网站内容相似度过高如何处理?

作者:鼎极网络发布日期:2019-11-12浏览次数:0

  通常来说,在网站的建设过程中,重复内容的产生很难避免,但是重复内容在很大程度上会影响网站在搜索引擎中的表现。今天和大家探讨的内容就是重复内容产生的原因以及解决方法。

  产生重复内容的主要原因

  1、正文内容越少相似度就会越高,相似度越高网站降权就越严重。主要表现在产品类网站,为什么呢,因为大多数是产品的图片,文字太少。

  2、正文的重复文字过多,也会导致相似度过高,那哪些东西会造成相似度过高呢?比如做产品站的,你的够买的流程是不是大多数都是相同的,版权以及联第方式,也是导致页面相似度过高的一个原因。

  那我们如何来杜绝呢?如果是做产品的,那么我们把每一个内容页面的图片做一个精准的描述。如果重复内容过多的见意做成图片上的文字来减少页面的相似度。

  如果内容过少我们可以这样来做:到互联网上找这个产品针对性的内容然后选取其内容,对我们自己的网页做内容伪原创,如果你是做百度的,你可以去360上去找内容然后把这些内容进行嫁结。如果你是产品类的见意你添加评论。评论你可以去淘宝、阿里上去找以此来减少页面的相似度。

  3、网站内容采集,就是内容源。如果你采集的内容跟互联网上的内容相似度过高而你的网站权重又不高,那么百度就会删除你的,解决办法就是(1)内容修改,对你所有采集的内容进行修改,但这个人工是非常大的,所以从一开始我们就做一个健康的网站是多么的重要。(2)修改内页不收录的页面的标题进行修改。

  4、网址规范化问题。

  网址规范化问题包括主域名的规范化和页面URL地址规范化两个方面,主域名的规范化需要规范化。另外是内页URL的规范化,通常为了让搜索引擎能够的抓取网站内容,我们会将URL进行伪静态处理,而一般的网站伪静态之后,原始的动态URL依然存在并能够访问,这样就造成了多个URL访问相同网址。

  5、内容的其他版本

  很多网站除了提供正常的版本之外还提供一些其它的浏览版本,比如打印版本或者简版,却并没有禁止搜索引擎去抓取这些页面,而这些页面也因此变成了重复内容页面。

  6、网站结构

  很多网站在结构设计之初并没考虑SEO方面的因素,结果是导致造成各种页面版本,比如产品按价格,评论,时间排序等,特别是一些电子商务网站,这种页面重复现象尤为严重。

  7、URL任意加字符还是返回200状态码。

  一些网站是因为网站程序和技术的原因,用户在URL参数后面随意加上一些字符都能够正常访问,并且页面是和没加之前的完全重复。

  检查页面是否有重复版本有一个比较简单的方法,就是将内容随机选择一句话加双引号后进行搜索,从结果中就可以看到有多少个重复的页面。因为通常来说随机选一句话进行搜索完全生命的机率是比较小的。

  END

  重复内容的危害

  1很多做SEO的存在一个误区,那就是认为如果网站上有重复内容就会被搜索引擎惩罚,其实倒没有这么严重,搜索引擎会在所有的重复页面中选择一个认为佳的版本去参与排名,其它相似的内容不会同时拥有排名。

  2那么问题也就来了,,搜索引擎如何去判断哪个页面是正版的,是否和网站管理员想的页面一致,如果搜索引擎判断失误,把原创的页面当成了复制内容,复制页面当成了原创页面,而你在进行推广的过程中却是原版,那就是做了无用功。第二,同一个网站内的页面存在多个复制内容会分散页面权重,既然页面在网站上出现了,就必然会有链接链向这个页面,而如果链接是统一的,那以全部的权重都可以进行集中,同时相同页面的收录在一定程度上也占用了搜索引擎蜘蛛的抓取精力,减少了原本真正需要进行抓取页面的收录机率。

  END

  消除复制内容的方法

  网址规范化问题好的方法是一个页面只对应一个URL,不要出现多个不同的版本,网站所有链接都指向这个URL。当然有些时候因为程度原来或者其它原因,无法完全统一为一个URL,那么我们可以采用以下三种方式进行集中权重。

  1,301重定向

  301能够传递页面的权重,目前来说主流搜索引擎都支持301重定向,可以将复制内容的页面全部通过301重定向的方式跳转到原版页面。

  2,robots文件禁止

  通过在robots.txt文件中禁止复制内容被搜索引擎抓取,也能有效的解决网址重复问题。

  3,canonical标签

  canonical标签是由谷歌,雅虎在2009年共同发布的一个新的标签,目前百度也表示支持canonical标签,这个标签也可以用于解决网址重复的问题。

  添加了以上标签后,也就相当于告诉搜索引擎哪个网址是规范原创的版本,其它复制内容都是指向这一个的网址,有一点页面301传递权重的意思,但是301是页面直接跳转了,而加这个标签后,页面还是停留在原始地址。


关键词:

  随着近之年网络技术的发展,seo的概念、属性、技术等等,可以说都发生了很大的变化。他不在仅仅局限于在代码、内容和链接上了,随着这种优化方式的在网络普及化的今天其重要性在逐步下降,越来越多具备基础SEO技术的网民不断的改良自己的网站,这其中也丰富发展了seo技术,其算法种类也不断上升,开始偏向搜索体验和用户口碑的方向在走。

  1、SEO的术语解释

  SEO在2000-2011年之间都是针对于主流搜索引擎友好度的一种网站站内外技术与内容的优化。通过接近搜索引擎算法的一种手段,所以称之为Search Engine Optimization (搜索引擎优化)。

  而从2011 – 2014年开始,搜索引擎优化不只局限在代码、内容和链接上了,因为这种优化方式的重要性在逐年下降,更多具备基础SEO技术改良的网站逐年上升。因此算法开始偏向搜索体验和用户口碑的方向在走,所以SEO如今更应该理解为Search Experience Optimization (搜索体验优化)

  2、SEO优化的属性

  不同营销都有自己的属性,如今的SEO也从之前大家都知晓的概念慢慢在转变,产品本身的属性也在发生微妙的变化。我们来看一下对比:

  【当下的SEO与以往的SEO有何不同】

  (1)以往的SEO入门和实施成本是比较低的,只要有意识的公司都可以在网上做SEO,效果相对也出现比较快,所以成为一种基础配备的营销手段。而当前SEO优化是一种豪华设施了,它的效果不是用则既有,而是需要公司投入更多的资源和时间,配备更多技术人员、公关人员、市场人员和内容营销人员,而大部分小公司无法做到团队的完整性。

  (2)以往SEO基本上都是推崇长期有效的概念,所以投资回报率比较高。而当前SEO不能再简单说是个长期效果的了,因为大家更注重是多久能出效果,长与不长已不是一个核心角色。所以SEO成为了中期出效的营销方法,若你的项目寻求短期出效的话,SEO并不合适。

  (3)这是大家很多年都在说的一个概念:SEO是免费流量。其实不然,所谓的免费只是基于流量入口是不是付了门票,但是别忘了去这个景点你在路上所要投入的路费和住宿费。所以当今,更建议大家把其成为回报流量,只要投入更多时间和资金才能获得回报的,并不是真正意义上的免费流量。

  (4)以往SEO都是经验当道,算法只是大家对于操作中的一种规律而不是一种公开化的规则。而如今这种规律一直在变较难定述,简单粗暴的一招鲜手法已经不存在了,取而代之的是更加勤勤恳恳的细活多工的实操。谁做的更多更细,工种越广,所能产生的效果合力就越强!

  3、SEO的优化金字塔

  当下的SEO与以往的SEO有何不同:

  当今SEO是贯穿、具有一定的连续性,并不是彰显独立的一个时代;无论你给它带上任何什么标签,它都不会脱离过去,废弃现在。所以原先三大块网站结构代码+关键词优化+链接广泛度是舍弃不了的。只是在于其基础上更要切实地贯穿用户体验融入+社媒力量宣导,从而使整个SEO体验和用户口碑给做上去。总结来说就是:打好底子的基础上+让内容和产品说话,前者是和搜索引擎做朋友,后者是迎合正真的用户。

  【以前的做法】 :

  以前做内容都是在网上随便找两篇相关的文章更新,在标题加入关键词,文章里面加几个关键词锚文本指向首页;外链也是随随便便的找几篇文章,然后在文章底部放一个网址;基本上没有什么技术活。

  【现在的做法】 :

  我们需要从建设网站前就把一些详细的东西规划好,比如做网站前:选择关键词(关键词要确定那些是主关键词的、哪个是品牌词、那些是长尾词都是需要我们一一的分析出来;然后再分析关键词是不是具有发展做的可能;确定好了,通过用户需求分析;用户想了解的是什么;然后做出一一的记录,也可以通过实际的市场来分析用户的需要)、规划好网站草图(分析出用户一些习惯)。

  总结一句话来说,即是如今的竞赛了,当一个职业有更多人参加时,天然加重了一个职业的竞赛度。

  几年前,去做一个对于“网上赚钱”的关键字,记得其时用的是zblog的程序,每天写一两篇文章,顺便发几个外链,半年的时刻,博客的流量就已经有600多IP/天,。而如今,想做一个日IP600的博客,是多么的不容易,这600IP都要从搜索引擎获取,就更显得难上加难了。但是我们做seo的朋友们永运把用户体验放在位,那么搜索引擎市场再怎么变化也不会偏离用户体验的,必须做到用户喜欢的,那么我们才可以长久不衰。