网站内容相似度过高如何处理?

作者:鼎极网络发布日期:2019-11-12浏览次数:24

  通常来说,在网站的建设过程中,重复内容的产生很难避免,但是重复内容在很大程度上会影响网站在搜索引擎中的表现。今天和大家探讨的内容就是重复内容产生的原因以及解决方法。

  产生重复内容的主要原因

  1、正文内容越少相似度就会越高,相似度越高网站降权就越严重。主要表现在产品类网站,为什么呢,因为大多数是产品的图片,文字太少。

  2、正文的重复文字过多,也会导致相似度过高,那哪些东西会造成相似度过高呢?比如做产品站的,你的够买的流程是不是大多数都是相同的,版权以及联第方式,也是导致页面相似度过高的一个原因。

  那我们如何来杜绝呢?如果是做产品的,那么我们把每一个内容页面的图片做一个精准的描述。如果重复内容过多的见意做成图片上的文字来减少页面的相似度。

  如果内容过少我们可以这样来做:到互联网上找这个产品针对性的内容然后选取其内容,对我们自己的网页做内容伪原创,如果你是做百度的,你可以去360上去找内容然后把这些内容进行嫁结。如果你是产品类的见意你添加评论。评论你可以去淘宝、阿里上去找以此来减少页面的相似度。

  3、网站内容采集,就是内容源。如果你采集的内容跟互联网上的内容相似度过高而你的网站权重又不高,那么百度就会删除你的,解决办法就是(1)内容修改,对你所有采集的内容进行修改,但这个人工是非常大的,所以从一开始我们就做一个健康的网站是多么的重要。(2)修改内页不收录的页面的标题进行修改。

  4、网址规范化问题。

  网址规范化问题包括主域名的规范化和页面URL地址规范化两个方面,主域名的规范化需要规范化。另外是内页URL的规范化,通常为了让搜索引擎能够的抓取网站内容,我们会将URL进行伪静态处理,而一般的网站伪静态之后,原始的动态URL依然存在并能够访问,这样就造成了多个URL访问相同网址。

  5、内容的其他版本

  很多网站除了提供正常的版本之外还提供一些其它的浏览版本,比如打印版本或者简版,却并没有禁止搜索引擎去抓取这些页面,而这些页面也因此变成了重复内容页面。

  6、网站结构

  很多网站在结构设计之初并没考虑SEO方面的因素,结果是导致造成各种页面版本,比如产品按价格,评论,时间排序等,特别是一些电子商务网站,这种页面重复现象尤为严重。

  7、URL任意加字符还是返回200状态码。

  一些网站是因为网站程序和技术的原因,用户在URL参数后面随意加上一些字符都能够正常访问,并且页面是和没加之前的完全重复。

  检查页面是否有重复版本有一个比较简单的方法,就是将内容随机选择一句话加双引号后进行搜索,从结果中就可以看到有多少个重复的页面。因为通常来说随机选一句话进行搜索完全生命的机率是比较小的。

  END

  重复内容的危害

  1很多做SEO的存在一个误区,那就是认为如果网站上有重复内容就会被搜索引擎惩罚,其实倒没有这么严重,搜索引擎会在所有的重复页面中选择一个认为佳的版本去参与排名,其它相似的内容不会同时拥有排名。

  2那么问题也就来了,,搜索引擎如何去判断哪个页面是正版的,是否和网站管理员想的页面一致,如果搜索引擎判断失误,把原创的页面当成了复制内容,复制页面当成了原创页面,而你在进行推广的过程中却是原版,那就是做了无用功。第二,同一个网站内的页面存在多个复制内容会分散页面权重,既然页面在网站上出现了,就必然会有链接链向这个页面,而如果链接是统一的,那以全部的权重都可以进行集中,同时相同页面的收录在一定程度上也占用了搜索引擎蜘蛛的抓取精力,减少了原本真正需要进行抓取页面的收录机率。

  END

  消除复制内容的方法

  网址规范化问题好的方法是一个页面只对应一个URL,不要出现多个不同的版本,网站所有链接都指向这个URL。当然有些时候因为程度原来或者其它原因,无法完全统一为一个URL,那么我们可以采用以下三种方式进行集中权重。

  1,301重定向

  301能够传递页面的权重,目前来说主流搜索引擎都支持301重定向,可以将复制内容的页面全部通过301重定向的方式跳转到原版页面。

  2,robots文件禁止

  通过在robots.txt文件中禁止复制内容被搜索引擎抓取,也能有效的解决网址重复问题。

  3,canonical标签

  canonical标签是由谷歌,雅虎在2009年共同发布的一个新的标签,目前百度也表示支持canonical标签,这个标签也可以用于解决网址重复的问题。

  添加了以上标签后,也就相当于告诉搜索引擎哪个网址是规范原创的版本,其它复制内容都是指向这一个的网址,有一点页面301传递权重的意思,但是301是页面直接跳转了,而加这个标签后,页面还是停留在原始地址。


关键词:

搜索引擎常用指令

————如何快速找到自己想要的结果

在百度和Google当中有一些常用的搜索指令我们可以用这些搜索指令定制自己的搜索结果,快速高效地找到需要的东西。以下就是几个常见的指令和它们的使用方法,有兴趣的可以试试。

1.专业文档搜索指令:filetype:

这个指令主要用于查找文档、资料的时候使用,可以直接找出自己想要的文本格式的资料。

使用方法:在普通的查询词后面,加一个filetype:+(文档格式)”对要的文档类型进行一个限定。(“filetype:”后可以跟以下文件格式:DOC、XLS、PPT、PDF、RTF、TXT、ALL等)

如:中国旅游地理 filetype:doc ,所搜索出来的就是所有叫中国旅游地理的DOC文档。需要其他格式的文档也只需要以此类推即可。

2.把搜索范围限定在网页标题中—— intitle:

我们互联网上有非常庞大数量的网页,搜索引擎辨别每个网页内容的重要途径就是查看这个网页的title标题,因为每个网页标题通常是对网页内容的集中归纳。因此,只需要把查询内容范围限定在网页标题中,往往能找到一些相关的网页和详细的内容,得到一个好的搜索结果。

使用方法:使用intitle:指令加上要搜索的内容

例如,搜索关于北京房山租车的专门网页,可以这样子用:intitle:北京房山租车,这样子得出的结果往往比只用 北京房山租车 这个词搜索得到的结果要准确。使用的时候要注意,intitle:和后面的关键词之间不要有空格。

 

3.把搜索范围限定在特定站点中——site:

在一些时候,如果我们知道某个网站中有自己需要找的东西,就可以把搜索范围限定在这个网站中,这样能提高查询效率。不过这个指令只能查询到那些被百度收录的网页,百度没有收录的那些网页是查不出来的。

使用方法:在查询内容的后面,加上site:(+网站域名)”。

例如,要找乐山乐水网站中关于上海导游的信息,就可以在百度搜索框输入:上海导游 site:www.ilsls.com, 所出来的就是乐山乐水网站内所有关于上海导游的信息了。要注意,site:”后面跟的网站域名,不要带“http://”;另外,site:和网站域名之间,也不要带空格。

4.查询域名下的反链——domain
其作用就是来查询域名下的反链。和site指令类似,domain域名也可以知道网站的健康状况,domain自己的域名是否在首页。
domain小技巧:可以利用domain自己的竞争对手的域名,从而获取更多外链的发布平台,作为己用。

 

5.把搜索范围限定在url链接中——inurl:

跟网页title一样,网页的url中往往也会包含一些重要的信息,显示这个链接的性质和页面的内容。因此,我们在查找信息的时候,对搜索结果的url做某种限定,就可以获得良好的效果。但是目前国内许多网站对SEO的忽视,还有很多的链接中没有关键词,所以这个指令的效果没有intitle:的效果好,一定程度上限制了结果展现。

使用方法:用 inurl: 后跟需要在url中出现的关键词,由于通用网址是拉丁字母或者数字,所以后跟的关键词一般使用拼音或者英文。同样的,inurl: 指令和后面所跟的关键词间不要有空格。

例如,找关于北京朝阳区包车信息,可以这样查询:北京包车 inurl:chaoyang .上面这个查询串中的“北京包车”,是可以出现在网页的任何位置,而“chaoyang”则必须出现在网页url中。

 

6.匹配——双引号和书名号

如果输入的关键词比较长,百度在经过分析后,给出的搜索结果中的查询词就有可能是拆分的。如果我们对这种情况不满意,可以尝试让百度不拆分查询词,完全按照输入的关键词的字数和顺序给出搜索结果。这只要在输入的时候给关键词加上双引号,就可以。

例如,搜索 北京石景山导游 ,如果不加双引号,搜索结果就会被拆分,既有北京石景山 导游,也可能会有北京 石景山导游等等,效果不是很好,但加上双引号后,“北京石景山导游”,得到的结果就是完全按照 北京石景山导游 这几个字的字数和顺序的结果了,不会被拆分开来,这样就我们的要求。

书名号是百度独有的一个特殊查询语法,在Google不通用。给关键词加上书名号的查询词,有三种特殊功能,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分,等同于双引号的作用;第三是可以将搜索结果的内容自然而然地区分出类别。 这个指令在查找一些有特定意义的电影或者书籍的时候就很有用。比如,查电影“神话”,如果不加书名号,很多情况下出来的是关于神话的五花八门的信息,而加上书名号后,《神话》结果就都是关于电影、书籍方面的了,自然的给分好类别了。

7.要求搜索结果中不含特定查询词

如果我们发现搜索结果中,有某一类网页是不希望看见的,而且,这些网页都包含特定的关键词,那么用减号语法,就可以去除所有这些含有特定关键词的网页。

例如,搜 哈利波特,但是不希望看到一些游戏方面的内容,就可以这样搜:哈利波特 –游戏,得到的结果中就不会有关于游戏的内容了。需要注意的是前一个关键词和减号之间必须有空格,否则,减号的功能就消失了。

8、不确定关键词的搜索指令—星号*)

有时候我们在搜索一些内容的时候,会常常忘记忘记一些重要的内容,比如地名、人名、书名等,只记得当中的一两个字,这个时候就可以使用星号来解决。

使用方法:在关键词中使用 * 来替代相关内容。比如,在百度输入:大*市,由于 * 是可以代表任何字符的,所以结果中可能就会有:大理市、大连市、大丘市、大田市、大阪市等等,再根据进一步搜索找到自己的结果即可。

以上的搜索指令都可以组合使用,熟练之后能够极大地提高搜索引擎的效率,快速地得到满意的内容。

 

SEO常用指令的组合

一、site+inurl组合

作用:查询咱们单个栏目的收录量,这样以来就能够更加了解到咱们网站的一个具体收录情况。

用法:site:网站首页地址   inurl:栏目地址。

实际操作如下图:

1.png

 

二、site+intitle组合

作用:查询某一类特定文章的数量,这样可以很的得到我们想要的结果。

 

用法:site:网站首页地址  intitle:标题特定词。

实际操作如下图:

 

2.png

 

三、intitle+inurl组合

 

作用:主要的是可以用来寻找相关主题的外链资源。

 

用法:intitle:主题关键词  inurl:bbs

 

实际操作如下图:

3.png

 

  百度基本搜索技巧

  百度搜索引擎简单方便。仅需输入查询内容并敲一下回车键(Enter),即可得到相关资料。或者输入查询内容后,用鼠标点击百度搜索按钮,也可得到相关资料。

  输入多个词语搜索

  输入多个词语搜索(不同字词之间用一个空格隔开),可以获得更的搜索结果。

  例如:想了解广州皮带生产厂家相关信息,在搜索框中输入获得的搜索效果会比输入广州皮带生产得到的结果。

  在百度查询时不需要使用符号”AND””+”

  百度会在多个以空格隔开的词语之间自动添加”+”。百度提供符合您全部查询条件的资料,并把相关的网页排在前列。

  减除无关资料

  有时候,排除含有某些词语的资料有利于缩小查询范围。百度支持“-”功能,用于有目的地删除某些无关网页,但减号之前必须留一空格。

  并行搜索

  使用“A|B”来搜索或者包含词语A,或者包含词语B”的网页。

  例如:您要查询广州皮带相关资料,无须分两次查询,只要输入广州|皮带搜索即可。 百度会提供跟“|”前后任何字词相关的资料,并把相关的网页排在前列。

  相关检索

  如果您无法确定输入什么词语才能找到满意的资料,可以试用百度相关检索。

  您可以先输入一个简单词语搜索,然后,百度搜索引擎会为您提供其它用户搜索过的相关搜索词语作参考。您点击其中一个相关搜索词