网站内容相似度过高如何处理？

作者：鼎极网络发布日期：2019-11-12浏览次数：8

　　通常来说，在网站的建设过程中，重复内容的产生很难避免，但是重复内容在很大程度上会影响网站在搜索引擎中的表现。今天和大家探讨的内容就是重复内容产生的原因以及解决方法。

　　产生重复内容的主要原因

　　1、正文内容越少相似度就会越高，相似度越高网站降权就越严重。主要表现在产品类网站，为什么呢，因为大多数是产品的图片，文字太少。

　　2、正文的重复文字过多，也会导致相似度过高，那哪些东西会造成相似度过高呢?比如做产品站的，你的够买的流程是不是大多数都是相同的，版权以及联第方式，也是导致页面相似度过高的一个原因。

　　那我们如何来杜绝呢?如果是做产品的，那么我们把每一个内容页面的图片做一个精准的描述。如果重复内容过多的见意做成图片上的文字来减少页面的相似度。

　　如果内容过少我们可以这样来做：到互联网上找这个产品针对性的内容然后选取其内容，对我们自己的网页做内容伪原创，如果你是做百度的，你可以去360上去找内容然后把这些内容进行嫁结。如果你是产品类的见意你添加评论。评论你可以去淘宝、阿里上去找以此来减少页面的相似度。

　　3、网站内容采集，就是内容源。如果你采集的内容跟互联网上的内容相似度过高而你的网站权重又不高，那么百度就会删除你的，解决办法就是(1)内容修改，对你所有采集的内容进行修改，但这个人工是非常大的，所以从一开始我们就做一个健康的网站是多么的重要。(2)修改内页不收录的页面的标题进行修改。

　　4、网址规范化问题。

　　网址规范化问题包括主域名的规范化和页面URL地址规范化两个方面，主域名的规范化需要规范化。另外是内页URL的规范化，通常为了让搜索引擎能够的抓取网站内容，我们会将URL进行伪静态处理，而一般的网站伪静态之后，原始的动态URL依然存在并能够访问，这样就造成了多个URL访问相同网址。

　　5、内容的其他版本

　　很多网站除了提供正常的版本之外还提供一些其它的浏览版本，比如打印版本或者简版，却并没有禁止搜索引擎去抓取这些页面，而这些页面也因此变成了重复内容页面。

　　6、网站结构

　　很多网站在结构设计之初并没考虑SEO方面的因素，结果是导致造成各种页面版本，比如产品按价格，评论，时间排序等，特别是一些电子商务网站，这种页面重复现象尤为严重。

　　7、URL任意加字符还是返回200状态码。

　　一些网站是因为网站程序和技术的原因，用户在URL参数后面随意加上一些字符都能够正常访问，并且页面是和没加之前的完全重复。

　　检查页面是否有重复版本有一个比较简单的方法，就是将内容随机选择一句话加双引号后进行搜索，从结果中就可以看到有多少个重复的页面。因为通常来说随机选一句话进行搜索完全生命的机率是比较小的。

　　END

　　重复内容的危害

　　1很多做SEO的存在一个误区，那就是认为如果网站上有重复内容就会被搜索引擎惩罚，其实倒没有这么严重，搜索引擎会在所有的重复页面中选择一个认为佳的版本去参与排名，其它相似的内容不会同时拥有排名。

　　2那么问题也就来了，，搜索引擎如何去判断哪个页面是正版的，是否和网站管理员想的页面一致，如果搜索引擎判断失误，把原创的页面当成了复制内容，复制页面当成了原创页面，而你在进行推广的过程中却是原版，那就是做了无用功。第二，同一个网站内的页面存在多个复制内容会分散页面权重，既然页面在网站上出现了，就必然会有链接链向这个页面，而如果链接是统一的，那以全部的权重都可以进行集中，同时相同页面的收录在一定程度上也占用了搜索引擎蜘蛛的抓取精力，减少了原本真正需要进行抓取页面的收录机率。

　　END

　　消除复制内容的方法

　　网址规范化问题好的方法是一个页面只对应一个URL，不要出现多个不同的版本，网站所有链接都指向这个URL。当然有些时候因为程度原来或者其它原因，无法完全统一为一个URL，那么我们可以采用以下三种方式进行集中权重。

　　1，301重定向

　　301能够传递页面的权重，目前来说主流搜索引擎都支持301重定向，可以将复制内容的页面全部通过301重定向的方式跳转到原版页面。

　　2，robots文件禁止

　　通过在robots.txt文件中禁止复制内容被搜索引擎抓取，也能有效的解决网址重复问题。

　　3，canonical标签

　　canonical标签是由谷歌，雅虎在2009年共同发布的一个新的标签，目前百度也表示支持canonical标签，这个标签也可以用于解决网址重复的问题。

　　添加了以上标签后，也就相当于告诉搜索引擎哪个网址是规范原创的版本，其它复制内容都是指向这一个的网址，有一点页面301传递权重的意思，但是301是页面直接跳转了，而加这个标签后，页面还是停留在原始地址。

关键词：

如何提高收录率

百度搜索引擎网页质量白皮书