百度蜘蛛304代码的含义及解决办法

最近分析天骄起名算命网的IIS日志,发现被拔毛之后,有许多百度蜘蛛爬行反馈为304代码的数据,304代码表示的含义是未修改,即未按预期修改文档。返回304代码是请求的网页与上次对比没有更新。意思是蜘蛛来到你的网站,你网站没有更新内容,并且与上次一样,就会返回304。

  304代码在网站日志中出现过多,会出现网站快照停止、收录减少、权重下降。如果网站在一段时间内,全部都是返回304代码,那么百度蜘蛛就会知道网站内容没有更新,网站快照就会相应被停止在某一天。同时,如果返回的304代码过多,达到一定的量,蜘蛛自然就不必那么勤快地过来网站爬行,从而收录量也会相应下降,从而导致权重的逐步下降。

  天骄起名算命网(www.tingko.com)IIS日志中显示,百度天天都正常爬行,百度统计中显示收录量也在逐步上升,但就是未被释放,其中一个原因,应该就是因为这个被重新置入沙盒之中观察。

  解决方法,简单的说,就是缺少更新,因此最近再次更新了天骄起名算命网数百篇文章,观察最新百度蜘蛛来到网站是否能找到新的内容,返回正常的200代码。

  关于网站IIS日志的设置与搜索引擎爬虫痕迹的分析独孤天骄曾经撰写过相关文章,大家可以参考http://www.dugutianjiao.com/post/iis-log-baiduspider.html ,转载请保留链接。


» 本文链接:https://blog.java-zone.org/archives/376.html
» 转载请注明来源:Java地带  » 《百度蜘蛛304代码的含义及解决办法》

» 本文章为Java地带整理创作,欢迎转载!转载请注明本文地址,谢谢!
» 部分内容收集整理自网络,如有侵权请联系我删除!

» 订阅本站:https://blog.java-zone.org/feed/

标签: 百度蜘蛛, 304代码, 含义, 解决办法

添加新评论