一、百度收录是什么意思
百度收录指的是被Baiduspider发现、采集、筛选、分析过的页面,表示网站中可以作为搜索候选结果的页面,即由百度蜘蛛抓取并认为网页内容符合收录规则或者说有价值,同时是百度索引库认可的内容。
二、百度收录的原理
只有符合百度搜索收录规则的内容才会在搜索引擎结果中给予一定的展现,其工作原理大概有以下3步。
1、与其他站点进行对比
将站点更新的内容与百度搜索引擎拥有的数据库内容进行比较,如果没有重复的,它就会收录,并保存缓存,然后确定是有价值有意义的内容再放出来参与排名。
2、对站点内容进行分类
将收录的内容与网站进行辨识,然后将这个网站进行分类,合理的分类会让内容更有效的参与排名。
3、进行评分排名
这里说到评分排名其实就是百度自己的算法机制,它需要将站点内容更好的做一个全面的综合评判,然后按照这个评分标准,确定网站排名优势。也就是将上面确定收录了的网站页面进行一个排名展示。
三、百度收录提交入口
百度搜索资源平台链接提交方式分为百度快速收录和百度普通收录两类,具体如下。
1、百度快速收录
开发者可通过快速收录工具,向百度搜索主动提交站点新增的高时效性资源,缩短爬虫发现网站链接的时间,一般情况下48小时内即可实现收录。
*百度快速收录截图
百度快速收录提交提交入口:https://ziyuan.baidu.com/dailysubmit/index。
关于百度快速收录的知识,请点击"什么是百度快速收录"。
2、百度普通收录
百度普通收录工具是网站主动向百度搜索推送数据的工具,可缩短爬虫发现网站链接时间,网站时效性内容建议使用普通收录工具,实时向搜索推送数据。百度普通收录可分为3种,一是API推送(主动推送),二是sitemap提交、三是手动提交,3种的特点如下:
API推送:最为快速的提交方式,建议您将站点当天新产出链接立即通过此方式推送给百度,以保证新链接可以及时被百度收录。
*API推送功能截图
sitemap:可以定期将网站链接放到Sitemap中,然后将Sitemap提交给百度。百度会周期性的抓取检查站长提交的Sitemap,对其中的链接进行处理,但收录速度慢于API推送。
*sitemap推送功能截图
百度Sitemap协议支持文本格式和xml格式,可以根据自己情况来选择任意一种格式组织sitemap。
关于sitemap的知识,请点击"什么是Sitemap"。
手动提交:如果不想通过程序提交,那么可以采用此种方式,手动将链接提交给百度,这种方式会比较费时且效率较低。
*手动推送功能截图
百度普通收录提交入口:https://ziyuan.baidu.com/linksubmit/。
四、百度收录的查询方法
1、输入网址查询(单链接查询)
在百度搜索框直接输入需要查询的网址,如果该网址已被百度收录,搜索结果直接显示该链接相关的结果,如下图:
*已被百度收录链接
如果该网址未被百度收录,搜索结果会提示该链接未被收录,同时未收录网页或者未收录新站也可以提交收录申请,如下图:
*未被百度收录链接提示
2、site命令查询(全站查询)
一个网站的百度收录量可用site命令查询,如site:www.youhuaxing.cn。site: 查询是一个搜索运算符,用于查询百度收录量。也可以使用它请求来自运算符中指定的特定网域、网址或网址前缀的搜索结果。site:www.example.com与site:example.com的查询结果是不一样的,site:www.example.com指的是www子域名下的收录量,site:example.com指的是整个example.com域名下的收录量。
3、工具查询
(1)、百度资源站长工具查询
索引量在百度搜索资源平台(https://ziyuan.baidu.com)查看,具体位置在:搜索服务 -> 数据查看->索引量,里面会以天为单位,记录索引量上涨或下跌的情况,百度自家产品,特点是非常精准。
*百度搜索资源平台查看收录量
(2)、使用站长工具查询
站长工具平台的百度近日收录查询(https://tool.chinaz.com/baidu)可查询一天内、一周内、一月内、一年内百度收录情况,但目前测试准确度有待提升。
*站长工具平台的百度近日收录查询
(3)、使用iis7站长之家查询(批量链接查询)
如果想批量查询已知链接的百度收录情况,可使用iis7站长之家(http://seo.iis7.com)进行批量链接查询,在输入批量链接后选中"百度是否收录"即可,该工具的优点是跨域名、批量查询,极大的提升了查询效率。如下图:
*iis7站长之家进行批量链接查询
五、百度不收录的原因分析
为什么提交了数据还是迟迟在线上看不到展现呢?涉及的因素很多,在百度蜘蛛抓取这个环节,影响线上展现的因素有:
1、网站封禁。先别笑,真的有站长一边封禁着百度蜘蛛,一边向百度狂交数据,结果当然是无法收录。
2、质量筛选。百度spider进入3.0后,对低质内容的识别上了一个新台阶,尤其是时效性内容,从抓取这个环节就开始进行质量评估筛选,过滤掉大量过度优化等页面,从内部定期数据评估看,低质网页比之前下降62%。
3、抓取失败。抓取失败的原因很多,有时你在办公室访问完全没有问题,百度spider却遇到麻烦,站点要随时注意在不同时间地点保证网站的稳定性。
4、配额限制。虽然百度正在逐步放开主动推送的抓取配额,但如果站点页面数量突然爆发式增长,还是会影响到优质链接的抓取收录,所以站点在保证访问稳定外,也要关注网站安全,防止被黑注入。
5、权重不够高。特别是一些新域名的网站,网站内容少、没有高质量内容或者很多内容是采集,同时网站又缺少高质量的外链,网页不被收录很常见。
六、提升百度收录的技巧
百度排名是一个长期坚持SEO优化的结果,不能做到及时排名(即刻见效)。要提升网站的百度排名,可以从网站内容、网页标题、网页关键词、站内优化、站外优化五大方面入手。
1、网站内容:内容为王,优质内容是好排名的关键因素。可以从内容契合、排版整齐、网站文章的原创性入手,切忌抄袭内容。
2、网页标题:网页标题是告诉搜索引擎网页的核心内容是做什么的,是一个网页获得展现的重要因素,尤其是网站首页的标题,设置一定要慎重,否则网站首页在关键词排名展现上受到约束。
3、网站关键词:对于新建的网站,关键词尽量从长尾关键词入手,会更有利于后期做网站推广,提升排名。
4、站内优化:通过网站内部优化,提高页面质量还有站内相关性建设,提升网站整体的用户体验。典型的有内链建设、相关推荐、代码规范等方法。
5、站外优化:发外链注意平台的相关性或者内容的相关性,尤其是知名大平台和行业门户的外链,这种外链平台质量非常高,发挥的作用也是相当大的。友情链接是简单有效的站外优化,可以发挥周边资源多换些同行网站的友链。
七、百度收录常见问题
1、网站页面被百度收录有什么好处?
答:页面只有被收录,才有可能有排名。网站整体的收录量越多,就有更多的页面参与排名,更多的网页有排名就月更多的流量。
2、为什么有时候收录的内容,回头再查询被删除了?
这种状况较多出现在新站上,新网站的相信度还不够,,尤其是新站采集的文章,因为新站的权重不高,收录后出现删除比较常见,遇到这种情况就需要站长持续的进行高质量原创内容发布了。
3、百度收录工具提交网站数据就可以收录码?
答:百度收录工具可以向百度搜索主动推送资源,缩短爬虫发现网站链接的时间,不保证收录和展现效果。
4、站长是否有必要使用百度收录工具逐个提交网址?
答:如果网站符合百度收录相关标准,会在1个月内按搜索引擎收录标准被处理,站长只需提供顶层网页即可,不必提交各个单独的网页,抓取工具能够找到其他网页。
总结
优化猩SEO:网站想获得百度排名,需要先获得百度收录,通过百度收录提交入口进行相关配置,将有利于百度对网站进行收录,但是想真正提高网站的收录量与排名,还是需要从内容质量着手。
参考链接:
百度不收录原因分析——spider抓取篇_百度搜索资源平台
https://ziyuan.baidu.com/college/articleinfo?id=1178
平台工具使用手册_普通收录_百度搜索资源平台
https://ziyuan.baidu.com/college/courseinfo?id=267&page=3
修改于2023-05-20