T086学习网 | 站长学院 | 技术文档 | 成语 | 歇后语 | 帝国时代 | 代码收藏 | IP地址查询 | 生活百科 | 生日密码 | CSS压缩 | 用户评论 | 欣欣百宝箱

每日搜索评论2--什么是用搜索引擎搜不到的[增补版]

【 搜索研究院作者:搜索引擎9238 更新时间:2003-08-21 | 字体:
[导读]每日搜索评论2--什么是用搜索引擎搜不到的[增补版] 搜索引擎9238 2002.1   没有搜索引擎是万万不能的,但搜索引擎不是万能的;   有些内容,网上明明存在,但是你用搜索引擎搜不到。如果事先理解搜索引擎能做的和...

每日搜索评论2--什么是用搜索引擎搜不到的[增补版]

搜索引擎9238 2002.1

  没有搜索引擎是万万不能的,但搜索引擎不是万能的;

  有些内容,网上明明存在,但是你用搜索引擎搜不到。如果事先理解搜索引擎能做的和不能做的,你就可以设计更佳的搜索策略。而搜索之前思考一下搜索策略,是搜索成功最关键的一步。


这样的内容,主要有3类:
======================

1、网上有,但是搜索引擎库里没有
------------------------------------------------------

1.1 spider未能正确处理的网页性质及文件类型
(如flash、script、ps、某些动态网页及frame、数据库)
1.2 没有指向链接的孤岛网页
1.3 spider访问时因为某些原因正好是死链接
1.4 被认为是劣质网页而不抓
1.5 因为/色情/反动/spam/等问题而不抓的非法网页
1.6 需要输入用户名、密码方可打开的网页
1.7 网站用robots协议拒绝搜索引擎抓取的网页
1.8 搜索引擎还未来得及抓取的新网页
1.9 gopher、newsgroups、Telnet、ftp、wais等非http信息
1.10 网站数据库做得太差劲,spider一抓就宕,只好不抓


2、搜索引擎库里有,但是未能正确索引网页中信息
------------------------------------------------------

2.1 分词引起误差
2.2 图型中的文字信息你看得懂但搜索引擎看不懂
2.3 停用词等搜索引擎故意不索引的信息
2.4 搜索引擎对某些网页有选择的索引,未索引全部网页信息


3、搜索引擎正确索引了网页中信息,但和你用的关键词不同
-------------------------------------------------------

3.1 你用的搜索关键词中含有错别字
3.2 网页作者用了错别字
3.3 没有错别字,但网页作者用的词汇和你的关键词不同,毕竟,文字的特性,允许有n种方式表达同一种信息
3.4 简体繁体不同编码


======================
家庭作业1:请思考、补充其它网上存在但搜索引擎搜不到的可能性

家庭作业2:请思考,以上哪些原因,你可以通过调整关键词和搜索策略来施加影响力;哪些原因,你只能接受和顺应? 非常感谢majing老师、diaopi老师的补充,欢迎其它补充。

  • 转载请注明来源:IT学习网 网址:http://www.t086.com/ 向您的朋友推荐此文章
  • 特别声明: 本站除部分特别声明禁止转载的专稿外的其他文章可以自由转载,但请务必注明出处和原始作者。文章版权归文章原始作者所有。对于被本站转载文章的个人和网站,我们表示深深的谢意。如果本站转载的文章有版权问题请联系我们,我们会尽快予以更正。
更多
留言建议ASP探针PHP探针站长Enjoy的Blog
© 2017 T086学习网 - T086.com(原itlearner.com)
RunTime:15.71ms QueryTime:7