T086学习网 | 站长学院 | 技术文档 | 成语 | 歇后语 | 帝国时代 | 代码收藏 | IP地址查询 | 生活百科 | 生日密码 | CSS压缩 | 用户评论 | 欣欣百宝箱

巧用robots避免蜘蛛黑洞

2014-10-22 22:46:15
以下是来自于百度站长学院的文章:对于百度搜索引擎来说,蜘蛛黑洞特指网站通过极低的成本制造出大量参数过多,及内容雷同但具体参数不同的动态URL ,就像一个无限循环的“黑洞”将spider困住,Baiduspider浪费了大量资源抓取的却是无效网页。 比如很多网站都有筛选功能,通过筛选功能产生的网页经常会被搜索引擎大量抓取,而这其中很大一部分检索价值不高,如“500-1000之间价格的租房”,首先网站(包括现实中)上基本没有相关资源,其次站内用户和搜索引擎用户都没有这种检索习惯。这种网页被搜索引擎大量抓取,只能是占用网站宝贵的抓取配额。那么该如何避免这种情况呢? 我们以... 查看详细内容 >>
巧用robots避免蜘蛛黑洞的相关文章推荐

百度教你正确识别百度蜘蛛

百度蜘蛛对站长还是比较神秘的,站长们经常提到百度蜘蛛。比如,百度蜘蛛是什么?最近百度蜘蛛来的太频繁服务器抓爆了;最近百度蜘蛛都不来了怎么办;还有很多站点想得到百度蜘蛛的IP段,想把IP加入白名单,但IP不固...

搜索引擎抓取系统概述(一)

我们常用的几家通用搜索引擎蜘蛛被叫做:Baiduspdier、Googlebot、Sogou Web Spider等。 Spider抓取系统是搜索引擎数据来源的重要保证,如果把web理解为一个有向图,那么spider的工作过程可以认为是对这个有向图的遍...

百度蜘蛛Baiduspider介绍

1. 什么是BaiduspiderBaiduspider是百度搜索引擎的一个自动程序,它的作用是访问互联网上的网页,建立索引数据库,使用户能在百度搜索引擎中搜索到您网站上的网页。2. Baiduspider的user-agent是什么?百度各个产品使...

周鸿一力推蜘蛛计划 谋划社区论坛广告模式

周鸿祎这次瞄准的是中小社区论坛。本报资料图片   本报记者 张见悦   4月16日,首届中国互联网社区大会在三亚闭幕,刚成立半年的网络新秀奇虎不惜重金促成了这次聚会。奇虎幕后老板周鸿祎之所以不惜血本,是为了...
更多
留言建议ASP探针PHP探针站长Enjoy的Blog
© 2017 T086学习网 - T086.com(原itlearner.com)
RunTime:16.29ms QueryTime:3