T086学习网 | 站长学院 | 技术文档 | 成语 | 歇后语 | 帝国时代 | 代码收藏 | IP地址查询 | 生活百科 | 生日密码 | CSS压缩 | 用户评论 | 欣欣百宝箱

Google如何工作?(二)

【 来源:奕天锐新作者:编译Lela 更新时间:2005-04-17 | 字体:
[导读]  Page和Brin早期还实现了另一项重要发明,即将“anchor text”――锚文本作为页面价值评估参数。锚文本一般以蓝色字体显示并以下划线标示,构成网页之间的链接文字。两位创始人均认为锚文本对链接页面提供了虽然可...
  Page和Brin早期还实现了另一项重要发明,即将“anchor text”――锚文本作为页面价值评估参数。锚文本一般以蓝色字体显示并以下划线标示,构成网页之间的链接文字。两位创始人均认为锚文本对链接页面提供了虽然可能不精确但却极为精炼的内容描述,因此其作用绝对不容小觑。此外,当用户使用人名或公司名称搜索时,锚文本的使用还可有效确保最佳网站能够出现在搜索结果的顶部。

  为搜索结果排序成为Google取得的最重要的改进之处,但这仅是搜索的一个方面,并且如果其他搜索引擎同样取得成功的效果这将成无用之地。事实上,这也意味着创建一个综合的保持更新的网页索引库。PageRank位列Google最强大的、最有效地基础构建之顶,它实际吸取了早期的,现已被人们遗忘的搜索引擎所采用的技术。

  回顾搜索历史

  上世纪90年代初,一大批搜索引擎开始了网页抓取索引工作。他们中的大部分起源于学术调研项目,其中作为首批成员的World Wide Web Wanderer记World Wide Web Worm采用的就是极为简单的技术,而且甚至不能够索引完整的网页,仅抓取了网页的标题、地址和头区信息。随后出现的部分商业搜索引擎均来自于学术研究项目(与Google的诞生相同)。WebCrawler于1994年诞生于华盛顿大学,这是世界上第一个能够索引完整网页的搜索引擎,后来被美国在线AOL收购,并成为 Lycos和InfoSeek的效仿对象。但直到1995年12月,由数字设备公司(Digital Equipment Corporation)Louis Monier推出的Altavista才是为第一个支持高级搜索语法的搜索引擎。

  Altavista在12月15日正式公开之前就已经拥有200,000访问用户,究其成功在于Altavista从三个方面满足了用户需求,这也是后来引导Google取得成功的关键。第一,它的网上索引范围超过了在此之前的任何一家搜索引擎。正如创始人Monier所说,相对于早期搜索引擎仅用一个爬行程序索引网络,AltaVisata则同时放出数百个“蜘蛛”在网上抓取资源。第二,Altavista速度快,几乎瞬间便可从庞大的数据库中为用户返回搜索结果。第三,如Monier所形容的,他们一流行起来就把所有早期搜索引擎打压下去了。原因使Altavista小组从一开始就采用了一种模块设计技术,使他们能够随着网站的流行,不断扩大处理能力。在当时形形色色、良莠不齐的搜索引擎之中,只有Altavista成为网络搜索的代名词。

  即使取得如此成绩,Altavista仍然没有取得Google分清良莠的强大功能。熟练用户可通过它的各种搜索语法(借助于数据库程序)找到自己需要的信息,但大多数用户还是不能如愿。虽然Altavista达到的前所未有的搜索范围和速度使其在搜索领域前进了一大步,但能够把搜索范围、速度及PageRank完美结合起来的Google最终实现了质的飞跃。(编译Lela)【未完待续】
  • 转载请注明来源:IT学习网 网址:http://www.t086.com/ 向您的朋友推荐此文章
  • 特别声明: 本站除部分特别声明禁止转载的专稿外的其他文章可以自由转载,但请务必注明出处和原始作者。文章版权归文章原始作者所有。对于被本站转载文章的个人和网站,我们表示深深的谢意。如果本站转载的文章有版权问题请联系我们,我们会尽快予以更正。
更多
留言建议ASP探针PHP探针站长Enjoy的Blog
© 2017 T086学习网 - T086.com(原itlearner.com)
RunTime:8.65ms QueryTime:7