一、网站地图 Sitemap是什么意思
网站地图又叫站点地图(英文:Sitemap),是一个网站所有链接的容器,是根据网站的结构、框架、内容,生成的导航网页文件。很多网站的连接层次比较深,爬虫很难抓取到,网站地图可以方便爬虫抓取网站页面,通过抓取网站页面,清晰了解网站的架构,网站地图一般存放在根目录下并命名sitemap,为爬虫指路,增加网站重要内容页面的收录。网站地图对于提高用户体验有好处,它们为网站访问者指明方向,并帮助迷失的访问者找到他们想看的页面。
二、网站地图 Sitemap的分类
网站地图根据使用目的不同分为以下两种:
1、供搜索蜘蛛抓取网站用的,一般是Sitemap.xml和Sitemap.txt文件,这一类站点地图包含了该网站的所有连接,让搜索引擎去收录网站内容。
2、供访问网站用户使用的,一般是sitemap.Html,这类文件将网站连接分类,整理后展现在用户面前,便于用户快速找到所需要的内容,提升用户体验。
三、网站地图 Sitemap的生成
网站地图sitemap是网站的页面的网址列表,通常用于向搜索引擎提交网址使用,网上有很多站点地图生成的方法,比如在线生成、软件生成等,可根据网站的架构和大小,使用以下三种方式来生成网站地图。
1、CMS系统生成网站地图
如果您使用的是易优、dede、phpcms、WordPress等知名的CMS,这些cms都配置好了网站地图自动生成功能,只需要在后台系统找到并开启即可。
2、手动创建网站地图
如果要创建的站点地图包含的网址不多,如10个左右,可以尝试用手动创建站点地图。即创建一个temap.txt文件,用Windows Notepad、Nano(Linux、MacOS)等文本编辑器,然后把URL网址复制粘贴到这个文本文件中就可以。这种方式的操作过程非常繁琐,不建议使用。
3、在线生成网站地图
网上有很多程序插件工具可以生成网站地图,比如小爬虫、站长工具、谷歌sitemap在线生成器等,步骤如下。
(1)、打开浏览器输入在线生成Sitemap网站的网址;
(2)、在表单里面填入要生成sitemap的网页的网址,然后点击提交;
(3)、打开了生成的数据结果页面,复制文本框里面的代码;
(4)、新建一个文本文件把代码粘贴进去,然后另存为utf-8格式的文件,文件名为sitemap.xml即可。
4、本地软件生成网站地图
网上下载地图生成工具,然后运行软件生成sitemap文件,最后将生成的sitemap的文件保存为xml文件就完成了。
四、网站地图Sitemap在搜索引擎提交
网站地图sitemap可以提交给各大搜索引擎,从而使搜索引擎更好的对网站页面进行收录,也可以通过robots.txt来告诉搜索引擎地图的位置。将制作好的网站地图上传至网站根目录下,最关键是把网站地图链接地址加入在 robots文件中以及做好网站地图在页面方便蜘蛛抓取的位置。
1、网站地图Sitemap的提交步骤
步骤一、将需提交的网页列表制作成一个Sitemap文件,文件格式使用Sitemap.xml或者Sitemap.txt。
步骤二、将Sitemap文件放置在网站目录下。比如您的网站为example.com,您已制作了一个sitemap_example.xml的Sitemap文件,将sitemap_example.xml上传至网站根目录,即example.com/sitemap_example.xml。
步骤三、登录搜索引擎站点管理中心,验证要提交Sitemap网站的归属权。
步骤四、找到Sitemap提交入口,提交"example"文件。
最后,提交完之后,可在Sitemap列表里看到提交的Sitemap文件,如果Sitemap文件里面有新的网站链接,可以选择文件后,点击更新所选,即对更新的网站链接进行了提交。
2、搜索引擎网站地图Sitemap的提交入口
(1)、百度Sitemap提交入口:https://ziyuan.baidu.com/linksubmit/
*API推送功能截图
(2)、搜狗Sitemap提交入口:https://zhanzhang.sogou.com/index.php/sitelink/index
(3)、360搜索Sitemap提交入口: rel="nofollow" target="_blank"https://zhanzhang.so.com/sitetool/sitemap
(4)、谷歌Sitemap提交入口:https://search.google.com/search-console/sitemaps
3、搜索引擎提交网站地图Sitemap注意事项
(1)、一个Sitemap文件包含的网址不得超过 5 万个,且文件大小不得超过 10 MB。如果您的Sitemap超过了这些限值,请将其拆分为几个小的Sitemap。这些限制条件有助于确保您的网络服务器不会因提供大文件而超载。
(2)、一个站点支持提交的sitemap文件个数必须小于5万个,多于5万个后会不再处理,并显示"链接数超"的提示。
(3)、如果验证了网站的主域,那么Sitemap文件中可包含该网站主域下的所有网址。
(4)、地图的主要目的是方便搜索引擎蜘蛛抓取的,如果地图存在死链或坏链,会影响网站在搜索引擎中网站权重的,所以要仔细检查有无错误的链接地址,提交前通过站长工具,检查网站的链接是否有效。
(5)、网站地图不要出现重复的链接,要采用标准W3格式的地图文件,布局要简洁,清晰,这样方便搜索引擎蜘蛛逐页爬行。
(6)、建议经常更新网站地图,经常的更新地图,便于培养搜索引擎蜘蛛爬行的粘度。经常有新的地图内容生成,长期以来,蜘蛛就会更关注,培养蜘蛛的爬行规则,这样网站内容能更快的被搜索引擎抓取收录。
五、网站地图 Sitemap的作用
1、搜索引擎通过爬虫在互联网爬行抓取页面,站点地图的作用就是给爬虫爬行构造了一个方便快捷的通道,因为网站页面通常是树状结构一层一层的链接,其中可能会存在死链接的情况,如果没有站点地图,爬虫爬行在某个页面就因死链接爬行不了,会造成抓取的内容缺失。
2、站点地图可以提高链接页面的权重,因为站点地图是指向其他页面的链接,此时站点地图就给页面增加了导入链接,大家知道导入链接的增加会影响到页面的权重,从而提提高页面的收录率。
3、将新发布的内容通过sitemap告诉搜索蜘蛛,蜘蛛再次抓取网站页面的时候会优先处理新发布的内容,从而提升搜索引擎的收录速度。
4、站点地图的存在不仅是满足搜索引擎爬虫的查看,更多是方便网站访客来浏览网站,特别是例如门户型网站由于信息量太多很多访客都是通过站点地图来寻找到自己需要的信息页面,这也能很好的提高用户体验度 。
六、网站地图 Sitemap常见问答
1、提交的网站地图Sitemap都会被搜索引擎抓取并收录吗?
搜素引擎对Sitemap已提交的数据,不保证一定会抓取及收录所有网址。是否收录与页面质量相关。
2、XML格式的 Sitemap 中,"priority"提示会影响网页在搜索结果中的排名吗?
不会。Sitemap 中的"priority"提示只是说明该网址相对于网站上其他网址的重要性,并不会影响网页在搜索结果中的排名。
3、网址在 Sitemap 中的位置是否会影响它的使用?
不会。网址在 Sitemap 中的位置并不会影响百度对它的识别或使用方式。
4、Sitemap中提交的url能否包含中文?
因为转码问题建议最好不要包含中文。
5、不同网址相同内容在Sitemap中如何处理?
如果不同网址下可供访问的内容相同,请选择常用网址加入站点地图,而不是将所有指向相同内容的网址都加入站点地图。
6、把sitemap写进Robots.txt中有什么好处?
搜索引擎蜘蛛在抓取页面的时候,会先查看Robots.txt,如果把sitemap写进Robots.txt中,就会增加网站收录的率,从而增加搜索引擎的友好性。
总结
优化猩SEO:网站地图sitemap的可以为爬虫抓取网站内容节省时间,SEOer务必对网站地图有足够的重视,最好将网站地图Sitemap文件提交到各大搜索引擎,从而增加爬虫对网站结构的认识,提高搜索引擎对网站页面的收录。
参考链接:
站点地图_百度百科
https://baike.baidu.com/item/%E7%AB%99%E7%82%B9%E5%9C%B0%E5%9B%BE/9991876
sitemap_百度百科
https://baike.baidu.com/item/sitemap/6241567
平台工具使用手册_普通收录_百度搜索资源平台
https://ziyuan.baidu.com/college/courseinfo?id=267&page=3
修改于2023-05-22