百度蜘蛛抓取,大家都知道,但是很多人不知道百度爬行过,经过系统评判以后,会被分成好几级,就是优质库、普通库、底层库。
① 网站收录量与页面排名的比例,比例越大,说明你网站越受欢迎。百度对网站索引建库的过程中,分为优质库、普通库、底层库三种,如果你的页面越来越多的收录在优质库当中,你的长尾关键词页面越来越多有排名,那么你能获取的流量也就越来越多,百度对于优秀页面都是优先排序的。
② 网站的收录时间长短,一般的企业网站,更新之后一般是隔天才能查到是否收录,但是一些大型网站或者优质企业站点,只能更新之后,能够被百度快速的建立索引收录,甚至达到秒收的结果。
③ 网站的关键词排名的词库越来越大,页面数量级越来越多,达到数万甚至十万百万级别。
网站的页面在百度眼里有三种评分等级,分为优质库、普通库、底层库三种:
一、百度优质库,这种页面会为网站带来80%流量。如何判断呢?
百度优质库页面和百度普通库页面,在site指令下的不同的表现:
1、在百度搜索该页面的全标题,在搜索结果的首页会出现该页面,搜索该页面的部分标题也会在首页出现,如下图:
2、在百度搜索该页面的URL,点击百度快照进去,百度快照有更新日期,蜘蛛会经常来抓取这个页面,抓取频率比较高;
3、优质库页面很容易在搜索结果中展示图片,如果该页面有图片的话,如下图:
明白了这些概念就好办了,我们现在要做的就是网站建设的优质库页面,为网站带来精准流量和转化。
这里我给出一个我认为比较合理的建设优质库页面的标准:
(1)根据用户需求,数据分析,建立关键词库;
(2)文章页面字数要求500字以上;
(3)多图,图片清晰,图片文件大小控制在200KB左右,ALT属性和标题主题及上下文相关,图片长宽比为5:3;
(4)根据关键词库来进行创作,原创或者整合编写,每一篇优质库页面一定是花费了编辑的心血编写而成的,这个可以制定相应的KPI制度奖惩内容的创建者;
(5)文章发布会,第一时间使用主动推送工具推送给百度。
二、百度普通库,该页能为网站带来少量流量,页面参与关键词排名。
那怎么判断页面进入了百度普通库呢?普通库的判断方法:
1、在百度搜索该页面的全标题,在搜索结果的首页会出现该页面,但是搜索该页面的部分标题,该页面就不在首页了;
2、在百度搜索该页面的URL,点击百度快照进去,百度快照有更新日期,这说明蜘蛛隔一段时间会来抓取这个页面;
3、普通库一般不容易在搜索结果中展示图片。
三、百度底层库,百度收录了该页面,但是基本上不会带来任何流量。
怎么判断页面是否进入了百度底层库呢?出现以下任何一种情况,都属于百度底层库:
(1)在百度搜索该页面的全标题,搜索结果中不会出现该页面,因为这个页面根本就没有参与排名;
(2)在百度搜索该页面的URL,点击百度快照进去,发现百度快照没有更新快照日期,直接就进入了该页面,这说明蜘蛛已经很少来抓取这个页面了。
我们应该尽量清理网站的底层库页面和长期不收录的没有任何价值和意义的页面,重新创建更多优质的页面,提升优质页面占网站总页面 的比例,这样百度给予网站的评分才会越来越高。
四、关于有效索引的概念:
有效索引意思就是被百度进行有效收录的页面,并参与排名的页面。百度目前在搜索结果中,只展示240个搜索结果,你搜索任何关键词,你的这个页面在这760个页面当中,这就属于有效收录;
五、关于缓存机制的概念:
你会发现,当你在百度搜索某个关键词的时候,在短时间内,搜索结果是不变的,这个就是因为缓存机制的原因。但是过一段时间之后,再去搜索这个关键词,搜索结果会发生一些变化,这个是因为在整个搜索引擎机制中还会涉及缓存淘汰和缓存跟新机制。
六、站长工具的权重是怎么算出来的呢,首先我们来看看规则:
站长工具是按照网站关键词和百度指数来判断网站能够从关键词获取多少流量:
百度权重1的话,那么预计能够从百度搜索获取的流量为:0-99;
百度权重2的话,那么预计能够从百度搜索获取的流量为:100-499;
百度权重3的话,那么预计能够从百度搜索获取的流量为:500-999;
外链建设虽然重要,但是应该放在次要位置,建设优质内容才是根本。一切能被搜索到的东西都可以被优化。