在一段时间里,我始终无法参透一个问题,为什么很多流量统计和百度统计的数据都对不上,而且SITE的数据和百度统计的数据相差甚大,这可能是搜索引擎的数据缓存问题,为什么是百度的数据缓存呢。当我们SITE一个站点时,得到的并不是实时的数据,而是百度的缓存数据,而很多流量统计系统都是依据SITE的数据,所以利用流量统计系统得到的数据也是百度的缓存数据,而百度统计得到的则是最及时的数据,故而两者产生了时间差。
搜索引擎的数据缓存会保留一段时间,可能是半个月,亦可能是一个月,在利用百度统计查看网站收录时,和SITE的数据一般是对不上的,我们以为SITE时看到的数据是最真实的,而百度统计则看不到具体的收录量,对百度统计产生了质疑。上个月的时间,我的SEO博客SITE时是10个收录量,而百度统计则只显示2个收录量,但一个月以后的今天,博客的收录量真的成了2,而之前的10个收录消失了。从这个事件可以说明,SITE的数据可能是缓存。
从目前来看,百度统计只是给出了收录量,而没有给出具体收录了哪些内容,和SITE相比,百度统计貌似欠缺了一些功能,但我们不要忘了,百度统计是百度官方的统计系统,最了解自己的肯定是自己,没有谁比百度更了解百度,而随着百度统计的升级,相信不久的将来,百度统计就能够显示具体收录了哪些数据了。在SITE网站内容时,有时会发现,一夜之间的收录下降或上升几百条,这可能和数据缓存也是有关系的,前一天你SITE到的数据可能是一个月之前的数据,而更新后的则是一个月以后的数据,所以才有了这么大的差距。
话说回来,如上的说法也只是博主自己的一种猜测,并没有得到官方的证实,百度只是声明,百度统计具有更高的准确性,鼓励大家使用百度统计。而到底搜索引擎的数据缓存是否属实,还有待验证。这里有一个最大的疑点,如果说SITE的数据是缓存,为什么文章发布以后,却能够直接SITE出来呢,既然能够这么及时的索引到新的内容,那么旧的内容也应该可以随时更新,也就不存在缓存问题了,那么百度统计和SITE的数据为什么这么大差距,到底以谁为准,又是一个尖锐的问题。