该来的总会来,搜索引擎已经明确声明保护原创文章,并且已经着手测试,当我看到这个消息的时候,还是忍不住有一些震惊,很多东西看似很简单,其实并不简单,以搜索引擎识别原创文章而言,实际操作起来难度相当大。具体什么样的文章才算是原创文章,利用伪原创软件制造的垃圾文章算不算原创文章,是不是应该给予排名,收录时间越早,就证明这篇文章是原创文章吗,如果按照收录时间来识别,那么,高权重的网站收录速度明显很快,新站的收录速度明显很慢,这个问题又该怎么解决呢,百度敢于走出这一步其实是需要非常大的勇气的,并不是想象中那么轻松。
还有一点就是段文杰SEO博客觉得百度在识别原创文章的过程中肯定会存在一些瑕疵,如果在识别过程中出现了瑕疵,站长应该保持理智和宽容的态度,多给百度一些时间,个人建议百度应该同时推出“原创文章投诉平台”,给原创作者一个申诉的机会,如果有人盗版了原创作者的内容,并且被百度错误的标记为原创文章后,作为原创作者可以通过“原创文章投诉平台”进行投诉,百度根据作者的投诉人工进行审核,判定谁的内容才是原创内容,这是一个相当巨大的工程,相信百度近期不会有这样的打算,但是站长还是应该感到万分欣喜,起码看到了百度的努力和进步。
那么百度究竟是如何识别原创文章的呢,段文杰SEO博客谈谈自己的看法。
第一:文章发布时间
第二:文章真实质量
第三:文章相似度
第四:文章发布平台
首先百度会根据文章的发布时间来判断,理论上收录最早的文章,如果互联网中不存在相似内容,百度会视为原创文章,但同时百度会根据内容的真实质量来衡量,如果是一篇垃圾文章,即使收录较早,相似度很低,百度也不会判定为原创文章,百度对于原创文章的判定也是需要“质量标准”的,百度还会根据发布平台来判断一篇文章的属性,如果一篇文章发布在“原创平台”,例如一些知名的原创博客和自媒体中,百度会视为原创文章。
不过段文杰SEO博客还要提醒大家,原创只是一种思维方式,而且互联网需要的是真实的,有质量的原创文章,只有高质量的,有思维性的原创文章,才能受到用户的认可,作为站长应该更倾向于“文章质量”,而不是一直纠结于文章是否为“原创内容”,互联网需要原创文章,但不需要垃圾原创文章,如果你的文章不能满足用户需求,即使搜索引擎给予了原创保护,同样不能产生价值。再次重申我的观点,原创不代表质量,高质量的原创才是关键。