网站镜像是目前比较泛滥的手法,破坏者会用一套程序实时抓取你的网页,当你有内容更新,它也会进行更新,从而让百度分不清哪个是真实网站,可能就会优先收录镜像网站的页面,从而你的站点内容,百度就不认为是原创文章,从而把排名都偏移到镜像的网站中。
一、网站被镜像的危害
网站被动镜像,就是被对手或者其他人通过非法的程序脚本恶意镜像你的网站。这种做法的后果是很严重的,它会导致你的网站关键词排名下降或者消失,危害是非常大的,因为你每天更新的内容都会被镜像网站盗取,从而优先收录,一般来说镜像网站都是老域名,对于收录都有绝对的优势。
从SEO角度看,权重不高的小站、新站,被镜像意味着有其它网站和你的网站内容基本一样,搜索引擎有可能认为你的网站不是原版,镜像网站才是,所以把排名、流量给了镜像网站。对有一定历史、权重的网站,镜像网站取代原版网站的可能性微乎其微。但从心情角度考虑,被别人镜像,内容被别人偷走,即使没有其它明显后果,也还是挺烦人的一件事。另一个烦人的事是,镜像网站一般来说并不是要和你提供同样的产品或服务。
网站被镜像,会有以下危害:
网站流量明显减少,关键词排名逐渐降低;
当网站被镜像后,不及时处理,时间一长很容易被降权,如果再想恢复就要花更多的时间与精力;
非法网站镜像,目的是为了快点提高他的域名初始权重,进而伪装进行牟利;
同行恶意竞争,通过镜像网站来使你网站降权等等
二、镜像网站程序可以做到什么:
1、全自动分析,内外链接自动转换、图片地址、css、js,自动分析CSS内的图片
2、内置强大替换和过滤功能,标签过滤、站内外过滤、字符串替换、等等
3、伪原创,近义词替换有利于SEO
4、增加URL路由,实现全站URL变换,个性化本站URL地址
5、超级模板增加移动模板、自定义栏目功能
6、增加自动获取301、302重定向的采集,解决跳WWW,跳https采集
7、代理IP、伪造IP、随机IP、伪造user-agent、伪造referer来路、自定义cookie,以便应对防采集措施。
三、怎么判断自己的站点是否被镜像
查看方法很简单,只要将自己网站的titile复制一下在百度里面搜索就好了,如果出现了多个和你一摸一样的,你就可以点击看看里面的内容,有90%是被镜像的。
有时候注意到被镜像了是因为自己网站排名下降,怀疑有人负面SEO。有时候是搜索品牌名称,看到镜像网站。
1、是百度统计后台:受访域名部分列出了使用相同百度统计代码的域名。其中出现快照、百度/谷歌翻译等是正常的,但出现一些奇奇怪怪的域名就要查看一下了。
2、是搜索网站的特征句子。最容易想到的是网站品牌名称、首页标题等,确实可以发现一些镜像网站。但有时品牌名绝大多数是会被替换的。
四、网站被恶意镜像怎么办
首先,一些在网上提到的解决办法其实并没有什么用。页面上的链接用绝对地址有帮助,其实小偷程序都会自动替换网址,用相对地址还是绝对地址没什么差别。页面上加上网站链接、网站名称、版权声明之类的,搜索引擎会识别哪个是正版。但镜像小偷程序连链接带文字都可以全部自动替换,这么做并没有用。
发现镜像网站后的处理原则就是让镜像网站不能在镜像域名上显示你的内容。考虑到镜像网站是要实时访问和调用被镜像的页面的,
所以可以考虑几个方法:
1、JS屏蔽镜像网站
比如用JS检测一下正在被打开的页面是不是在自己的域名上,是的话正常显示,不是的话(域名是镜像网站时)强迫转向到自己域名:
< script > if (window["location"]["host"] != 'www.cjzzc.com' && window["location"]["host"] != 'cjzzc.com') { alert('警告!检测到该网站为恶意镜像站点,将立即为您跳转到官方站点!'); window["location"]["href"] = 'http://' + 'www.cjzzc.com/'; } < /script>
不过这种方法只对用户有效,搜索引擎不执行JS,还是会抓取到镜像内容。也可以用PHP写脚本判断和转向。有时候由于种种原因,程序不起作用。
2、屏蔽镜像网站来访问的IP地址
直接的方法是屏蔽镜像网站来访问的IP地址,先查一下镜像网站服务器IP。把对方主机IP先屏蔽了。不过镜像网站来实时抓取用的IP大部分情况下不是域名主机IP,可能是CDN,可能是伪造IP,也可能是多IP的服务器。要发现必须屏蔽的IP,需要查看网站原始日志。我的一个小窍门是,访问镜像网站上一个很少人会访问的页面,比如翻页第70页,然后马上查看日志,这个页面被访问的IP就是应该屏蔽的IP。
镜像网站经常是会伪造或实时轮换IP地址的,如果屏蔽一个IP网站还能访问,就再访问翻页69页、68页等等,找到更多IP。屏蔽也可以屏蔽IP段。我的经验是,通常镜像网站不会使用超过10个IP地址。
3、通过站长平台进行反馈
通过域名、title即轻松判断为镜像的恶劣站群,如果依然在各关键词下获得排名,可以通过站长平台进行反馈
https://ziyuan.baidu.com/feedback/
4、百度平台投诉
无法快速区分真假的站点需要保护自我权益的站点可以向百度投诉:
https://www.baidu.com/duty/right.html
提供各种资质证明,会有百度法务部的员工审核处理。在这里提醒各位站长,请尽可能提供最全最有说服力资质证明,包括且不限于网站备案证明、品牌营业证明等,以帮助工作人员快速判断。
5、百度站长投诉
如果站长发现镜像站点同时做恶劣赌博、色情内容,可以到站长举报平台
http://jubao.baidu.com/jubao/
百度公司相关员工会进行处理。处理网站被镜像的方法基本就是这些,如果被镜像的网站站已经死链或者在相关关键词下没有排名,那证明镜像站点已被反作弊策略识别并处理,被镜像的站长也就不用担心了。
6、网站使用绝对路径
相对路径下的网站被他人镜像的话图片会被显示出来,但如果是绝对路径的话就会挂掉,而且即使被镜像了,网站上的内容如果有链接也只会跳到你的站点上。
7、第一时间提交并反馈给百度
先找到镜像你网站的人,联系他们看他们愿不愿意删除镜像页面,如果不同意,就可以找百度投诉。百度举报平台进行举报
8、网站启用HTTPS
可以防止部分程序镜像我们的网站,提高用户的信任。网站做好了SSL,可以阻止一部分的镜像劫持程序