搜索引擎原理技术与系统pdf第二版|百度网盘下载

时间: 2022-05-15 03:02:54  17 搜索引擎 搜索引擎 搜索引擎原理

编辑评论:

搜索引擎原理技术与系统第二版是在第一版基础上的升级版,详细介绍了互联网搜索引擎的原理。这本书非常值得一读!

搜索引擎原理技术与系统pdf

搜索引擎原理技术及系统介绍

《搜索引擎——原理技术与系统(第二版)》系统介绍了互联网搜索引擎的工作原理、实现技术和系统建设方案。 《搜索引擎——原理技术与系统(第二版)》分为三部分,共13章。第一部分介绍了搜索引擎的基本原理和技术,描述了一个小而简单的搜索引擎实现的具体细节;第二部分详细论述了大型分布式搜索引擎系统的设计要点和关键技术;第二部分结合“中国网络信息馆”和“中国互联网数字资源财富库”的实践经验,介绍了构建大型网络历史网页和非网页存储系统的技术和方法,以及中文网页的自动分类与聚类、开放领域问题系统的构建等。

《搜索引擎-原理技术与系统(第二版)》层次清晰,由浅入深,第1、二章涉及的内容提供源码下载地址;既有深入的理论分析,又有大量的实验。数据和程序具有学习性和实用性的双重意义。

搜索引擎原理技术与系统部分章节

第 1 章简介,第 1 部分:网络搜索引擎的基本原理和技术

第二章网络搜索引擎工作原理与架构

第三章网络信息采集

第四章:收集信息的预处理

第五章信息查询服务

第 6 章可扩展集合子系统

第7章网页净化与去重

第8章高性能检索子系统

第9章相关排名和系统质量评估

搜索引擎原理技术及系统概述

2005年4月,在华夏人才基金的支持下,本书第一版出版。那个时候,虽然互联网搜索引擎对于网民来说已经不是一个陌生的概念,但系统地介绍搜索引擎原理和实现技术用于构建实际系统的书籍已经很少见了。因此,本书第一版的出版应该说是比较及时的,对许多年轻的计算机技术人员起到了启迪作用。事实上,多年来,我们多次收到读者关于这本书对他们职业生涯的影响的反馈。许多最初的读者现在是搜索公司的骨干。截至 2011 年 5 月,《搜索引擎——原理、技术和系统》已经印刷了七次。我们很高兴一本相对专业的书能受到这么多读者的喜欢。

同时我们也看到,随着互联网的不断发展,搜索的重要性也越来越突出;而我们也看到一个现象,相当多的有实力的互联网公司进入了搜索领域。战略和行动,不要因为百度和谷歌放弃那个市场。这种现象造成了搜索技术人才的巨大缺口,尤其是具有一定搜索引擎开发经验的人才。看到这种需求,很多高校都开设了相关课程。看到这种需求,不少学者编写了具有自己特色的教科书和专着。例如郭军的《网络搜索》,董守斌、袁华的《网络信息检索》,刘义群、马少平、洪涛、刘自正的《搜索引擎技术基础》。许多出版社也看到了这一需求,大量引进了相关的外文书籍。

那么,既然市场上已经有这么多关于搜索引擎技术的书籍,为什么还要出版这本书呢?其实我们4年前就有这个想法,只是因为客观原因推迟了。最根本的原因是搜索引擎技术的发展和对搜索引擎技术前沿的深入理解,让我们觉得原书中的一些内容不再重要,应该包含一些新的内容。

2003 年秋天,在编写本书第一版时,主要工作基础是“天网搜索”,它曾经是中国最好的搜索引擎,也是我们引以为豪的搜索引擎。围绕“天网搜索”的发展,北大网络实验室培养了一批优秀的学生。这本书第一版的内容多是对那些学生的实际工作经验的总结,所以一方面总体上确实实用,但另一方面也有一些不够成熟和不完善的地方。深度。同时,在过去的七年里,北大网络实验室在搜索引擎技术的研究工作上也取得了深入的进展,尤其是在搜索评价和高性能索引结构方面。内容。

本书保留了第一版第一部分的大部分内容,即搜索引擎的基础知识,这些内容多年来没有改变;删去第一版第9、12、13章,增加第10、11、13章,分别介绍“中国网络信息馆”、“中国数字财富库”和基于搜索开发的开放域问答系统自2002年以来的发动机技术和运行。同时,对第一版中的一些小节进行了实质性修改。总体来看,第二版大约有45%的内容是新的,总长度比第一版大了30%左右。

鉴于我们在第一版中的一个特点——详细介绍了一个小型搜索引擎(TSE)并提供了源代码,引起了很多读者的兴趣,纷纷下载并发邮件询问,很高兴在这里通知各位读者:北大网络实验室将开放天网搜索系统的所有源代码。使用该源代码构建的系统可以收集和处理数以亿计的网页,它体现了与本书多个章节相对应的技术。

还有另外两个原因促使我们完成了第二版的修订。一是2011年与百度合作承担国家项目“基于盒计算的新一代搜索引擎和浏览器”。虽然在指定的任务中没有要求,但我们相信这样的书可以在项目完成后出版。也是一件幸福的事。第二,2003年,我们发起了“全国搜索引擎与网络信息挖掘学术研讨会”。第一届在北京大学举办后,每年由全国不同高校举办。许多人在会议的组织上付出了巨大的努力。他们是华南理工大学董守斌、清华大学李星、山东大学马军、海南大学雷京生、江西师范大学王明文、大连理工大学林鸿飞、西华大学杜亚军、和来自河北大学的袁。正方形。今年是第十届,又在北京大学举行。本书的出版,不仅是对本届会议的致敬,也是对十年来举办的“全国搜索引擎与在线信息挖掘学术研讨会”的致敬。感谢所有贡献的朋友,以及所有参加会议的人。

  • 声明:本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,以上内容仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站内容来自网络收集整理或网友投稿,所提供的下载链接也是站外链接,版权争议与本站无关。您必须在下载后的24个小时之内,从您的设备中彻底删除上述内容。如果您喜欢该程序和内容,请支持正版!我们非常重视版权问题,如有侵权请邮件与我们联系处理。敬请谅解!邮箱:121671486@qq.com,微信:diqiuren010101

学习考试资源网-58edu © All Rights Reserved.  湘ICP备12013312号-3 
站点地图| 免责说明| 合作请联系| 友情链接:学习乐园