Gzip压缩对seo的影响

作者:鼎极网络发布日期:2019-11-13浏览次数:98

  Gzip压缩

  GZIP是GNUzip的缩写,它是一个GNU自由软件的文件压缩程序。它是Jean-loupGailly和MarkAdler一起开发的。次公开发布版本是1992年10月31日发布的版本0.1,1993年2月发布了版本1.0。
  GZIP早由Jean-loup Gailly和Mark Adler创建,用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz的文件,它们就是GZIP格式的。现今已经成为Internet 上使用非常普遍的一种数据压缩格式,或者说一种文件格式。
  HTTP协议上的GZIP编码是一种用来改进WEB应用程序性能的技术。大流量的WEB站点常常使用GZIP压缩技术来让用户感受更快的速度。这一般是指WWW服务器中安装的一个功能,当有人来访问这个服务器中的网站时,服务器中的这个功能就将网页内容压缩后传输到来访的电脑浏览器中显示出来.一般对纯文本内容可压缩到原大小的40%.这样传输就快了,效果就是你点击网址后会很快的显示出来.当然这也会增加服务器的负载. 一般服务器中都安装有这个功能模块的。

网站的gzip压缩对网站的收录和权重有没有影响?

官方回复:gzip对收录和权重没有影响。对搜索引擎的影响,是抓取速度会快一些。相反在当前是被提倡的,速度快的网站更能获得用户和搜索引擎的好感,并且在站长平台网站优化建议中也提倡站长使用gzip压缩,提升网站速度。
  启用Gzip压缩的好处

它的好处显而易见,提高网页浏览速度,无论是之前说的精简代码、压缩图片都不如启用Gzip来的实在。下图为启用Gzip后的效果。

1.png 

  网页启用Gzip压缩 提高浏览速度
  Gzip压缩效率非常高,通常可以达到70%的压缩率,也就是说,如果你的网页有30K,压缩之后就变成了9K左右。


关键词:

  网址规范化指的是搜索引擎挑选合适的URL作为真正(规范化的)网址的过程。

  一、首先,为什么会出现不规范网址?

  如图所示:

  http://maxseo.cn

  http://www.maxseo.cn

  http://www.maxseo.cn/index.html

  http://maxseo.cn/index.html

  上面这几个URL指的是同一个文件:首页

  从技术上来说,这几个URL都是不同的网址,搜索引擎也确实把他当作不同的网址,虽然这些网址返回的都是相同的文件,也就是首页。但从技术上来说:主机完全可以对这几个网址返回不同的内容。那么,除了图上带与不带www造成的,以及结尾是否带有index.html后缀造成的不规范网址外,其实还有以下几种原因会造成。例如:

  ①:网站程序的原因,不少CMS系统经常出现一篇文章可以通过几种不同的URL去访问。

  ②:URL静态化设置存在错误,同一篇文章中有多个静态化URL可以访问。如图(截图URL和访问的标题):

  

1.png

  

2.png

  

3.png

  ③:URL静态化后,静态和动态URL共存,都有链接,也都可以访问。

  ④:网站的目录后带与不带斜杠。如图:

  下图为不同的网址,但其实是一个页面。

  http://www.baidu.com

  http://www.baidu.com/

  ⑤:加密网址。如图:

  下图的URL同时存在,但都可以访问。

  http://www.baidu.com

  https://www.baidu.com

  ⑥:URL中有端口号。如图:

  http://www.baidu.com80/

  http://www.baidu.com/

  ⑦:跟踪代码。有喜欢做网络推广的人,习惯在URL后面加跟踪代码。如图:

  http://www.baidu.com/?*100

  二:其次,出现网址不规范会给网站带来什么问题?

  网站出现多个不规范网址会给搜索引擎收录和排名带来很多的麻烦,为什么不规范的URL会给搜索引擎和排名带来很多麻烦?为了让站长彻底的明白,我们举个例子,比如:网站首页是固定的且只有一个,但很多站长在链接回首页的时候所使用的URL并不是的,而是一会连到http://www.esobao.cn,一会连到http://www.esobao.cn/index.html。

  一般来说,虽然不会给用户造成什么麻烦,但因为这些网址都是同一个文件,会间接性的给搜索引擎造成困惑,搜索引擎会认为:到底哪一个网址才是真正的首页?哪一个网址应该被当作首页返回?那么,这里有个重点:如果网站上不同版本的网址同时出现,就会很可能被搜索引擎收录。被收录之后,后果就可想而知了。而此时,搜索引擎在计算排名的时候必须要找到所谓规范化的网址,也就是搜索引擎认为的合适的URL版本。

  不规范化会造成的问题,笔者简单的来说下:

  ①: 网站上有多个URL,这样会分散页面权重,不利于排名。

  ②:搜索引擎判断的规范化网址并不是站长想要的那个网址。如图(站长想要的是不带后缀的,搜索引擎去把带后缀的给收录了):

  

4.png

  ③:如果网址规范化问题太严重,也可能影响收录。因为:一个权重不是很高的域名,能收录的总页面数和蜘蛛总爬行时间是有限的,而搜索引擎把资源花在收录不规范的网址上,留给独特内容的资源就变得越来越少了。

  ④:重复页面过多,搜索引擎可能认为有作弊嫌疑。

  ⑤:对于搜索引擎来说,浪费资源、浪费宽带。

  三、后,如何解决网址规范化的问题

  关于如何解决网址规范化问题,可能这个对于站长而言是重点也是核心内容了。那么,可以解决URL规范化问题的方法有很多,比如接下来我们要说的这些:

  ①:现在企业、个人站长用的程序多的就是CMS,那么此时你就要确定你使用的这个CMS系统是否只能产生规范化网址,无论是否有静态化,比如DEDE、帝国CMS等。

  ②:所有内链要保持统一,都指向规范化网址。比如:以带与不带www为例子,确定一个版本为规范化网址后,网站的内部链接都要统一使用这个版本,这样搜索引擎就会明白哪一个是站长希望的网站规范化网址。而从用户体验的角度去看:用户通常选择就是带www的版本为规范化网址。

  ③:301转向。这个常用也是普遍的一个方法,站长可以通过301转向把不规范化URL全部转向到规范化URL。

  ④:canonical标签。目前也是站长使用比较多的一种了,而且百度也是全面支持这个标签了。

  ⑤:制作XML地图,地图中全部使用规范化网址,然后提交给搜索引擎。

  虽然方法很多,但很多方法都有局限性,比如:有的网站因为技术的缺失或不成熟,导致301无法实现。再比如:很多CMS系统经常无法受自己控制等等。那么,笔者这里主要针对301和canonical做下具体的说明,因为这两种规范化方式是站长常用的手段,而且也是百度认同的。