《搜索革命》彭鹏,梁春晓编著|(epub+azw3+mobi+pdf)电子书下载

时间: 2022-10-17 10:11:27  45 epub epub 编著

图书名称:《搜索革命》

【作 者】彭鹏,梁春晓编著
【丛书名】互联网实验室·互联网革命丛书
【页 数】 288
【出版社】 北京:企业管理出版社 , 2004.09
【ISBN号】7-80197-120-5
【分 类】网站-简介
【参考文献】 彭鹏,梁春晓编著. 搜索革命. 北京:企业管理出版社, 2004.09.

图书目录:

《搜索革命》内容提要:

本书分为9章,内容包括搜索在互联网中的位置、搜索革命以及搜索的价值来源、搜索引擎技术、各类搜索应用模式、搜索的未来和机会等。

《搜索革命》内容试读

第一章

是ě泰!¥酥搜索引擎简史

回1.1前互联网搜索时代

1.2互联网搜索时代

回1.3搜索引1擎大事记

一章

搜索引擎简史

录,需要自己提交每一个网页的简介索引信息,类似于后来大家熟知的

Yahoo

1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中最负盛名的

三个是:苏格兰的Jump Station、美国科罗拉多州立大学Oliver McBryan的The

World Wide Web Worm(First Mention of McBryan's World Wide Web Worm)NASA的Repository-Based Software Engineering(RBSE)spider。随着互联网的迅速发展,使得检索所有新出现的网页变得越来越困难,因此,在Matthew Gray的

Wanderer基础上,一些编程者将传统的“蜘蛛”程序工作原理作了些改进。其设想是,既然所有网页都可能有连向其他网站的链接,那么从跟踪一个网站的链接开始,就有可能检索整个互联网。然而Jump Station和WWW Worm只是以搜索工具在数据库中找到匹配信息的先后次序排列搜索结果,因此毫无信

息关联度可言。而RBSE是第一个在搜索结果排列中引入关键字串匹配程度

概念的引擎。

1993年2月,6个Stanford(斯坦福)大学学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。这就是Ecie。后来曾以概念搜索闻名,2002年5月,被nfospace收购的Excite停止自己的搜索引擎,改用元搜索引擎Dogpile

1994年1月,第一个既可搜索又可浏览的分类目录EINetGalaxy(Tradewave Galaxy)上线。除了网站搜索,它还支持Gopher和Telnet搜索。

1994年4月,斯坦福大学的两名博士生,美籍华人Jerry Yang(杨致远)和

David Filo共同创办了Yahoo。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为Yaoo的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。这种方式使搜索效率明显提高。(Yahoo以后陆续使用Altavista、Inktomi、Google提供的搜索引擎服务)

l994年初,Washington(华盛顿)大学CS学生Brian Pinkerton开始了他的小

Web Crawler Brian Pinkerton Announces the Availability of Webcrawler).1994年4月20日,Neb Crawler正式亮相时仅包含来自6000个服务器的内容。

Web Crawler是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它

之前,用户只能通过URL和摘要搜索,摘要一般来自人工评论或程序自动取正

文的前100个字(后来Neb Crawler陆续被AOL和Excite收购,现在和Excite一样改用元搜索引擎Dogpile)。

第一

搜索引掌简史

1.2互联网搜索时代

最早现代意义上的搜索引擎出现于1994年7月。当时Michael Mauldin将John Leavitⅷ的蜘蛛程序接人到其索引程序中,创建了大家现在熟知的

Lycos.。同年4月,斯坦福大学的两名博士生,David Filo和美籍华人杨致远(Gerry Yang)共同创办了超级目录索引Yahoo,并成功地使搜索引擎的概念深入人心。从此搜索引擎进入了高速发展时期。目前,互联网上有名有姓的搜索引擎已达数百家,其检索的信息量也与从前不可同日而语。比如最近风头正劲的Google,其数据库中存放的网页已达30亿之巨!

随着互联网规模的急剧膨胀,一家搜索引擎光靠自己单打独斗已无法适应目前的市场状况,因此现在搜索引擎之间开始出现了分工协作,并有了专业的搜索引擎技术和搜索数据库服务提供商。像国外的Inktomi,它本身并不是直接面向用户的搜索引擎,但向包括Overture(原GoTo)、LookSmart、.MSN、

HotBot等在内的其他搜索引擎提供全文网页搜索服务。国内的百度也属于这

一类,搜狐和新浪用的就是它的技术。因此从这个意义上说,它们是搜索引擎的搜索引擎。

Lycos(Carnegie Mellon University Center for Machine Translation Announces

Lycos)是搜索引擎史上又个重要的进步。卡内基·梅隆大学(Carnegie Mellon

University)的ichael Mauldin将John Leavitt的spider程序接入到其索引程序中,创建了Lycos。1994年7月20日,数据量为54000 documents的Lycos正式发布。除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第

一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引擎的数据量:1994年8月一394000 documents;1995年1月一1.5million documents;1996年11月一超过60 million documents(注:1999年4月,ycos停止自己的Spider,改由Fast提供搜索引擎服务)。

Infoseek(Steve Kirsch Announces Free Demos Of the Infoseek Search Engine)是另一个重要的搜索引擎,虽然公司声称1994年1月已创立,但直到年底它的搜索引擎才与公众见面。起初,Infoseek只是一个不起眼的搜索引擎,它沿袭Yahoo和Lycos的概念,并没有什么独特的革新。但是它的发展史和后来受到的众口称赞证明,起初第一个登台并不总是很重要。Infoseek友善的用户界面、大量附加服务(例如UPStracking,News,adirectory,and the like)使它声望日

搜索引擎简史

隆。而1995年12月与Netscape的战略性协议,使它成为一个强势搜索引擎:当用户点击Netscape浏览器上的搜索按钮时,弹出Infoseek的搜索服务,而此前由Yahoo提供该服务。(注:Infoseek后来曾以相关性闻名,2001年2月,

Infoseek停止了自己的搜索引擎,开始改用Overture的搜索结果。)

1995年,一种新的搜索引擎形式出现了一元搜索引擎(A Meta Search

Engine Roundup)。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第一个元搜索引擎,是Washington大学硕士生Eric Selberg和Oren Etzioni的Metacrawler。元搜索引擎概念上好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。

DEC的AltaVista(2001年夏季起部分网友需通过p-rox灯y访问,无p-roxy可用qbseach单选altavista搜索,只能显示第一页搜索结果)是一个迟到者,1995年12月才登场亮相(AltaVista Public Beta Press Release)。但是,大量的创新功能使它迅速到达当时搜索引擎的顶峰。Altavista最突出的优势是它的速度。而Altavista的另一些新功能,则永远改变了搜索引擎的定义。AltaVista是第一个支持自然语言搜索的搜索引擎,AltaVist扣是第一个实现高级搜索语法的搜索引擎(如AND,OR,NOT等)。用户可以用AltaVista搜索Newsgroups(新闻组)的内容并从互联网上获得文章,还可以搜索图片名称中的文字、搜索

Titles、搜索Java applets、搜索ActiveXobjects.。AltaVista也声称是第一个支持用

户自己向网页索引库提交或删除URL的搜索引擎,并能在24小时内上线。

AltaVista最有趣的新功能之一,是搜索有链接指向某个URL的所有网站。在面向用户的界面上,AltaVista也作了大量革新。它在搜索框区域下放了“ips”以帮助用户更好的表达搜索式,这些小i叩经常更新,这样,在搜索过儿次以后,用户会看到很多他们可能从来不知道的的有趣功能。这系列功能,逐渐被其它搜索引擎广泛采用。1997年,AltaVista发布了一个图形演示系统LiveTopics,帮助用户从成千上万的搜索结果中找到想要的。

然后到来的是HotBot。1995年9月26日,加州大学伯克利分校CS助教

EricBrewer、博士生PaulGauthier创立了Inktomi(UCBerkeley Announces Inktomi),1996年5月20日,Inktomi公司成立,强大的HotBot出现在世人面前。声称每天能抓取索引1千万页以上,所以有远超过其它搜索引擎的新内容。HoBo也大量运用cookie储存用户的个人搜索喜好设置。(Hotbot曾是随后几年最受欢迎的搜索引擎之一,后被Lycos收购。)

Northernlight公司于1995年9月成立于马萨诸塞州剑桥,1997年8月,

···试读结束···

  • 声明:本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,以上内容仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站内容来自网络收集整理或网友投稿,所提供的下载链接也是站外链接,版权争议与本站无关。您必须在下载后的24个小时之内,从您的设备中彻底删除上述内容。如果您喜欢该程序和内容,请支持正版!我们非常重视版权问题,如有侵权请邮件与我们联系处理。敬请谅解!邮箱:121671486@qq.com,微信:diqiuren010101

学习考试资源网-58edu © All Rights Reserved.  湘ICP备12013312号-3 
站点地图| 免责说明| 合作请联系| 友情链接:学习乐园