T086学习网 | 站长学院 | 技术文档 | 成语 | 歇后语 | 帝国时代 | 代码收藏 | IP地址查询 | 生活百科 | 生日密码 | CSS压缩 | 用户评论 | 欣欣百宝箱

译文:搜索引擎算法和研究

【 来源:奕天锐新作者:brian_shi 更新时间:2005-07-06 | 字体:
[导读]  作为搜索者或搜索引擎优化专业人士,你真的需要理解支持搜索引擎的算法和技术吗?在近来召开的一次搜索引擎战略会议上,搜索引擎算法和研究座谈小组专家的答复是肯定的:绝对有必要。    这是一份来自于2005...

  作为搜索者或搜索引擎优化专业人士,你真的需要理解支持搜索引擎的算法和技术吗?在近来召开的一次搜索引擎战略会议上,搜索引擎算法和研究座谈小组专家的答复是肯定的:绝对有必要。
  
  这是一份来自于2005年2月28到3月3日在美国纽约召开的搜索引擎战略会议中的特殊报道。

  这个搜索引擎算法和研究座谈小组的成员包括:ASK Jeeves的产品管理和搜索技术副总裁Rahul Lahiri,Smart Interactive(近来被webSourced收购)的CEO,Mike Grehan以及来自于Mi Islita.com的Edel Garcia博士。

  问题的来龙去脉是什么?

  “我们真的需要了解搜索引擎技术层次上的所有内容吗?”Grehan问道。“是的!”他毫不含糊地进行了回答并继续解释当你理解了搜索引擎算法所带来的竞争优势。

  “如果你知道是什么原因使得一个文档的 排名比另外一个要高,你可以有策略地优化并更好地为客户服务。而且,如果你的客户问道:‘为什么我的竞争对手总在前20名,而我却没有?搜索引擎的工作原理是什么?’如果你说‘我不知道——他们就那样——你认为他们还能让自己的账户存在多久?”

  Grehan通过引用Brian Pinkerton——在1994年第一个开发出全文本检索搜索引擎的人的解释了自己的观点。“给它照相,”他解释说:“一个客户进入一个大型旅行用品商店,这个商店中什么都有,可用于世界各地的旅游,他看着在那里的小伙子,不加思索地问道 ‘旅游’。你想那个销售人员该从何讲起?”

  搜索引擎用户想通过最小的感知和最大的快乐实现他们的目标。他们输入查询时不会仔细考虑的,他们采用不准确的3个词进行搜索,而且也没有学习正确的查询组成。这使得搜索引擎的工作更加困难。

  搜索法、充裕问题和算法的演变

  Grehan继续谈论搜索法在文件排名中的重要作用。“多种让人着魔事情的组合一道就产生了排名。我们应尽可能多地了解信息,因此,当我们谈论一篇文章的排名为什么要比另一篇高时,我们至少应能拿出一些证据说明正在发生什么。”

  Grehan说明了随着时间的推移,搜索引擎算法的进程。早期的搜索引擎中,文本极其重要。但搜索研究家Jon Kleinberg发现了他所称之为的“充裕问题”。当输入一个搜索,然后返回包含适当文本的成千上万个网页时会出现充裕问题。你如何知道哪个是最重要的或者最合适的网页?搜索引擎如何确定哪个网页应出现在搜索结果列表的顶部?搜索引擎算法必须不断地向复杂性方面发展,以便适应过于充裕的问题。

  来自于ASK Jeeves的看法

  根据来自于ASK Jeeves Rahul Lahiri的说法,在网络上,ASK Jeeves财产 排名第七,在 搜索引擎中排名第四,Lahiri列举了对ASK Jeeves搜索引擎来讲是关键因素的几项内容,包括索引大小、内容的新鲜程度和数据结构。ASK Jeeves对数据结构的关注是很独特的,且通过这种方法与其他搜索引擎进行区分。

  在网络搜索中有两种关键的驱动因素:内容分析和链接分析。Lahiri确认ASK Jeeves将网络视为一幅图画并将查看它们之间的链接关系,并尝试绘制相关信息之间的簇。

  通过将网络分成不同的信息区块,ASK Jeeves可以根据来自于每个区块的权威“知识”来更好地理解一个查询并将更适应主题的查询结果提供给搜索者。如果你有一个较小的站点,但在你的区块中非常相关,你的站点可能比有些提供相关信息的区块之外大站点排名更好一些。

  为什么共现非常重要

  Edel Garcia博士被耽误了,未能在座谈小组中给大家作报告,但他准备了一份具有配音说明的PowerPoint文件。主持人Chris Sherman告诉大家,就当幻灯片是由Garcia博士给大家解说的。

  Garcia博士是一位对人工智能和信息检索具有特殊兴趣的专家。他解释到,共现的短语更会倾向于被认为是相关的或者“相互联系的”。另外,语义联合影响我们对一个词语的理解。当我们看到“aloha(夏威夷人问候语:欢迎,再见)”一词时,我们想到的是“Hawaii(夏威夷)”,为什么?这是因为词语之间语义的联合。根据Garcia的观点,共现理论可以用来理解词语、商标和产品和服务等等之间的语义联合。

  Garcia博士然后提出了一个问题。为什么我们必须关注搜索引擎中的词语联合?他的答案是:考虑一下关键词商标联合。这对搜索市场营销含义非常重要。

  如果想了解Garcia博士更多的理论,请访问搜索引擎观察论坛Keywords Co-occurrence and Semantic Connectivity。

  座谈会以气氛活跃的问答形式结束。搜索引擎算法的演变趋势如何?Grehan已经有了现成的答案:他期望能引入概率性潜在语义索引和概率性超文本导引主题搜索。那些满口的行话是什么意思?你必须参加下次搜索引擎会议才能找到答案。

  关于作者:
  
  Christine Churchill 是 KeyRelevance.com的总裁,这时一家提供全方位自然搜索引擎优化、战略链接建立、可用性测试和付费点击管理服务的搜索引擎市场营销的公司。

  • 转载请注明来源:IT学习网 网址:http://www.t086.com/ 向您的朋友推荐此文章
  • 特别声明: 本站除部分特别声明禁止转载的专稿外的其他文章可以自由转载,但请务必注明出处和原始作者。文章版权归文章原始作者所有。对于被本站转载文章的个人和网站,我们表示深深的谢意。如果本站转载的文章有版权问题请联系我们,我们会尽快予以更正。
更多
留言建议ASP探针PHP探针站长Enjoy的Blog
© 2017 T086学习网 - T086.com(原itlearner.com)
RunTime:16.81ms QueryTime:7