什么是死链&死链的标准
页面已经无效,无法对用户提供任何有价值信息的页面就是死链接,包括协议死链和内容死链两种形式:
1)协议死链:页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、403、503状态等。
2)内容死链:服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面。
出现原因
1、 动态链接在数据库不再支持的条件下,变成死链接。
2、某个文件或网页移动了位置,导致指向它的链接变成死链接。
3、网页内容更新并换成其他的链接,原来的链接变成死链接。
4、网站服务器设置错误
5、网站还没有完全做好,就上传到服务器上去了,这样也很多死链的。
6、某文件夹名称修改,路径错误链接变成死链。
影响
一、有可能会让搜索引擎降权
二、用户体验较差
死链的产生会让浏览你的站点人对你的网站产生反感,而搜索引擎的蜘蛛程序爬到这里的时候,发现前方的路不通,它有可能就会丢弃,不再向前爬,这样给它的影响就不好。
搜索引擎是不太喜欢把一个带有死链的站点排在前面的,当然这不是的情况,是属于大部分的。
遇到网站出现死链接,解决的办法就是删除死链接或者修复死链接,让网站结构更加顺畅。
内容死链的检查(通过死链检查工具Xenu)
死链的处理
通过百度死链工具处理(参考百度站长工具)
网址规范化指的是搜索引擎挑选合适的URL作为真正(规范化的)网址的过程。
一、首先,为什么会出现不规范网址?
如图所示:
http://maxseo.cn
http://www.maxseo.cn
http://www.maxseo.cn/index.html
http://maxseo.cn/index.html
上面这几个URL指的是同一个文件:首页
从技术上来说,这几个URL都是不同的网址,搜索引擎也确实把他当作不同的网址,虽然这些网址返回的都是相同的文件,也就是首页。但从技术上来说:主机完全可以对这几个网址返回不同的内容。那么,除了图上带与不带www造成的,以及结尾是否带有index.html后缀造成的不规范网址外,其实还有以下几种原因会造成。例如:
①:网站程序的原因,不少CMS系统经常出现一篇文章可以通过几种不同的URL去访问。
②:URL静态化设置存在错误,同一篇文章中有多个静态化URL可以访问。如图(截图URL和访问的标题):
③:URL静态化后,静态和动态URL共存,都有链接,也都可以访问。
④:网站的目录后带与不带斜杠。如图:
下图为不同的网址,但其实是一个页面。
http://www.baidu.com
http://www.baidu.com/
⑤:加密网址。如图:
下图的URL同时存在,但都可以访问。
http://www.baidu.com
https://www.baidu.com
⑥:URL中有端口号。如图:
http://www.baidu.com80/
http://www.baidu.com/
⑦:跟踪代码。有喜欢做网络推广的人,习惯在URL后面加跟踪代码。如图:
http://www.baidu.com/?*100
二:其次,出现网址不规范会给网站带来什么问题?
网站出现多个不规范网址会给搜索引擎收录和排名带来很多的麻烦,为什么不规范的URL会给搜索引擎和排名带来很多麻烦?为了让站长彻底的明白,我们举个例子,比如:网站首页是固定的且只有一个,但很多站长在链接回首页的时候所使用的URL并不是的,而是一会连到http://www.esobao.cn,一会连到http://www.esobao.cn/index.html。
一般来说,虽然不会给用户造成什么麻烦,但因为这些网址都是同一个文件,会间接性的给搜索引擎造成困惑,搜索引擎会认为:到底哪一个网址才是真正的首页?哪一个网址应该被当作首页返回?那么,这里有个重点:如果网站上不同版本的网址同时出现,就会很可能被搜索引擎收录。被收录之后,后果就可想而知了。而此时,搜索引擎在计算排名的时候必须要找到所谓规范化的网址,也就是搜索引擎认为的合适的URL版本。
不规范化会造成的问题,笔者简单的来说下:
①: 网站上有多个URL,这样会分散页面权重,不利于排名。
②:搜索引擎判断的规范化网址并不是站长想要的那个网址。如图(站长想要的是不带后缀的,搜索引擎去把带后缀的给收录了):
③:如果网址规范化问题太严重,也可能影响收录。因为:一个权重不是很高的域名,能收录的总页面数和蜘蛛总爬行时间是有限的,而搜索引擎把资源花在收录不规范的网址上,留给独特内容的资源就变得越来越少了。
④:重复页面过多,搜索引擎可能认为有作弊嫌疑。
⑤:对于搜索引擎来说,浪费资源、浪费宽带。
三、后,如何解决网址规范化的问题
关于如何解决网址规范化问题,可能这个对于站长而言是重点也是核心内容了。那么,可以解决URL规范化问题的方法有很多,比如接下来我们要说的这些:
①:现在企业、个人站长用的程序多的就是CMS,那么此时你就要确定你使用的这个CMS系统是否只能产生规范化网址,无论是否有静态化,比如DEDE、帝国CMS等。
②:所有内链要保持统一,都指向规范化网址。比如:以带与不带www为例子,确定一个版本为规范化网址后,网站的内部链接都要统一使用这个版本,这样搜索引擎就会明白哪一个是站长希望的网站规范化网址。而从用户体验的角度去看:用户通常选择就是带www的版本为规范化网址。
③:301转向。这个常用也是普遍的一个方法,站长可以通过301转向把不规范化URL全部转向到规范化URL。
④:canonical标签。目前也是站长使用比较多的一种了,而且百度也是全面支持这个标签了。
⑤:制作XML地图,地图中全部使用规范化网址,然后提交给搜索引擎。
虽然方法很多,但很多方法都有局限性,比如:有的网站因为技术的缺失或不成熟,导致301无法实现。再比如:很多CMS系统经常无法受自己控制等等。那么,笔者这里主要针对301和canonical做下具体的说明,因为这两种规范化方式是站长常用的手段,而且也是百度认同的。