几年前做网站的时候,从来没有查看过网站日志,这段时间网站的收录很不正常,于是开始观察SEO博客每天的网站日志,从中发现了一些小小的规律,以前我认为,只要百度蜘蛛已经索引过的内容会马上释放出来,现在才明白,搜索引擎的数据释放时需要时间的,我们要想看到更多数据被释放出来,要有一定的耐心去等待,释放数据的时间间隔可能是几天,也可能是十几天,甚至更长。
从段文杰博客这几天的情况来看,百度蜘蛛的活跃度是非常高的,单是昨天的时候,就索引了大概四五十个页面,这几天以来,百度蜘蛛索引的页面至少有两三百之多,但是百度统计的数据只有三十个页面左右,直接site的数据更低,只有七个左右,这说明百度蜘蛛的索引量和百度统计数据之间有一个过渡时间,个人猜测大概是这么一个过程,现实百度蜘蛛进行日志索引,经过第一道审核,审核完成以后,把数据提高给百度统计,接着经过第二道审核,二次审核完成以后,这些数据才会出现在搜索引擎的搜索结果中,等有人搜索相关数据时,才有可能出现你的网站数据。
这就是问题的原因所在了,为什么看到百度蜘蛛来了很多次,索引了很多页面,但是百度统计的数据还是没有提升。为什么百度统计显示的数量为好几百,而site的数据只有几十条。原因很简单,因为从百度蜘蛛的索引到百度统计的数据,再从百度统计的数据量到数据出现在搜索引擎中,两个过程之间都是需要时间的。要等到所有的数据都出现在搜索结果中,可能需要一个比较漫长的过程。
还是以这个博客来举例,现在的百度蜘蛛已经索引了几百条数据了,而百度统计的数据依然停留在三十条左右,site的数据更是少的可怜,只有区区的七八条数据。一般情况下,百度蜘蛛所引导的数据,基本都会释放出来,但百度蜘蛛索引的数据不一定百分百释放,有一些数据经过搜索引擎判断后,可能被搜索引擎视为盗版内容,这些内容会被封藏起来,永远不会出现在搜索引擎中。