网址规范化 之 301转向:
①:什么是301转向?
301转向又称301重定向、301跳转,是用户或蜘蛛向网站服务器发出访问请求时,服务器返回的HTTP数据流中头信息部分状态码的一种,表示本网址性转移到另一个地址。
另外,还有其他的网址转向方法,例如:302转向、javascript转向、PHP/ASP/CGI程序转向等。这里有个重点:除了301转向外,其他的方法都是常用的作弊手法,虽然方法本身没有对错之分,但被作弊者用多了,搜索引擎对可疑的转向都是非常敏感等。所以,其他的方法还是少用为妙。
②:301转向传递权重
例如:网页A用301重定向转到网页B,搜索引擎可以肯定网页A性改变地址,或者说实际上不存在了,搜索引擎就会把网页B当作的有效目标。而且,更重要的是:网页A积累的页面权重将被传递到网页B。
举个例子:http://www.esobao.cn/是选定的规范化网址,下面的几个网址都做301转向到选定的规范化网址上,这样搜索引擎就知道它是规范化网址,而且会把这三个网址的权重都传递集中到规范化网址上。
http://maxseo.cn
http://maxseo.cn/index.html
http://www.maxseo.cn/index.html
可能有站长会问:301转向多久可以生效?一般来说的话,在百度站长工具的改版工具上做下规则提交,大概一周左右就会生效。
③:怎么样做301转向?
关于怎么做301转向,这里建议参考这篇文章:(http://www.chinaz.com/web/2013/1212/330808.shtml)本篇文章,有详细的301转向操作方法,完全适合个人站长和企业站长。由于文字太长,这里就不写了。
网址规范化 之 canonical标签(参考下百度站长平台给出的标准):
①:canonical标签有什么作用?
对一组内容完全相同或高度相似的网页,通过使用Canonical标签可以告诉搜索引擎哪个页面为规范的网页,能够规范网址并避免搜索结果中出现多个内容相同或相似的页面,帮助解决重复内容的收录问题,避免网站相同内容网页的重复展示及权重的分散,提升规范网页的权重,优化规范网页的排名。
②:如何用canonical标签指定规范网址?
可通过在每个非规范版本的 HTML 网页的 部分中,添加一个 rel="canonical" 链接来进行指定规范网址。
例如,要指定指向网页 http://www.admin5.cn/product.php?id=15786 的规范链接,需要按以下形式创建 元素:
<link rel=”canonical” href=”http://www.admin5.cn/product.php?id=15786”/>
然后将上述链接复制到某网页所有非规范网页版本的 部分中(例如 http://www.admin5.cn/product.php?id=15786&active=1),即可完成设置。
③:可设置规范网页的几种情况举例:
举例一、社区帖子可能由于置顶、突出颜色等行为导致内容完全相同的一个网页产生不同的链接,搜索引擎只会选择其中一个链接建立索引,如以下两个链接不同,内容完全相同的页面:
http://www.a5.net/forum.php?mod=viewthread&tid=17868770&page=1#pid115642474
http://www.a5.net/thread-17868770-1-1.html
举例二、对商品的列表页面,按照价格或者优惠等顺序进行排序,但网页内容高度相似:
http://mall.leho.com/pr-list?locid=75fb2a357d38397c5e1e75fa&cid=5e1e02f950a4101fb27571ee&order=discount
http://mall.leho.com/pr-list?order=price_asc&locid=75fb2a357d38397c5e1e75fa&cid=5e1e02f950a4101fb27571ee
举例三、网站有多个网页展示的为相同型号的商品,只是每个网页商品图的颜色不同,其他内容几乎完全相似,此时也可设置rel="canonical",将当下流行色彩的商品网页设置规范网页,百度有优先将其显示在搜索结果中。
④:百度会完全遵守rel="canonical"标签吗?
网页中添加该标签后,就代表站长向百度某个网页作为规范的网页版本,百度会同时根据标签的及系统算法选择出合适的网页将其显示在搜索结果中。百度会根据网页内容实际情况考虑Canonical标签中的网页,但不完全遵守该标签。为了标签的效果,请一个页面中仅有一个Canonical标签。
⑤:此链接是相对的还是的?
rel="canonical" 可与相对链接或链接一起使用,但建议您使用链接,以大程度地减少可能出现的混乱或问题。
⑥:rel="canonical"标签可用于在不同的域名中建议规范网址吗?
如果网站需要更换域名,且使用的服务器不能创建服务器端重定向网址的情况下,就可以使用rel="canonical" 链接元素指定希望百度收录域的网址。
301 404案例;
页面301处理
if Request.ServerVariables("Http_Host") ="xxxx.com" then
Response.Status="301 Moved Permanently"
Response.AddHeader "Location","http://www.xxxx.com/"
Response.End
end if
多域名处理
if Request.ServerVariables("Http_Host") ="xxxx.com" or Request.ServerVariables("Http_Host") ="xxxx.com" then
Response.Status="301 Moved Permanently"
Response.AddHeader "Location","http://www.xxxx.com/"
Response.End
end if
下面的情况基本上都是虚拟主机常用配置
新一代数据中心http://gzidc.com/
301设置
.htaccess
单域名301
RewriteEngine On
RewriteBase /
RewriteCond %{HTTP_HOST} ^lszygw.com$ [NC]
RewriteRule ^(.*)$ http://www.lszygw.com/$1 [L,R=301]
多域名处理
RewriteEngine On
RewriteBase /
RewriteCond %{HTTP_HOST} ^lszygw.com$ [OR]
RewriteCond %{HTTP_HOST} ^linxigang.com$ [OR]
RewriteCond %{HTTP_HOST} ^www.linxigang.com$ [NC]
RewriteRule ^(.*)$ http://www.lszygw.com/$1 [L,R=301]
404设置
404.Asp
恒爱网络http://www.zzhidc.com/
301设置
httpd.ini 文件的代码如下 :
[ISAPI_Rewrite]
CacheClockRate 3600
RepeatLimit 32
RewriteCond Host: ^abc.com$
RewriteRule (.*) http://www.abc.com$1 [I,RP]
如
[ISAPI_Rewrite]
CacheClockRate 3600
RepeatLimit 32
RewriteCond Host: ^jnzhipin.net$
RewriteRule (.*) http://www.jnzhipin.net$1 [I,RP]
RewriteCond Host: ^jnzhipin.com$
RewriteRule (.*) http://www.jnzhipin.net$1 [I,RP]
RewriteCond Host: ^www.jnzhipin.com$
RewriteRule (.*) http://www.jnzhipin.net$1 [I,RP]
把以上内容修改成你自己的之后,把 httpd.ini 上传到你空间网站根目录 wwwroot下 。
用FTP连接到空间,在wwwroot 同级目录建立一个名为 others 的新文件夹,如下图
接下来去 http://pan.baidu.com/s/1gd42ZQj 下载ISAP组件,解压之后得到 rewrite2.dll
把 rewrite2.dll 上传到 others 目录里。
然后 登陆到你空间管理后台的 “独立面板”里,找到 “ISAP映射”,点击之后进入添加映射,筛选器名称 随便写个,路径如图所示写路径,然后点击后面的“设置”
404设置(用404.htm)
益息网络http://www.idc1.net/
301设置()
在根目录下有个index.asp文件
if Request.ServerVariables("Http_Host") ="xxxx.com" then
Response.Status="301 Moved Permanently"
Response.AddHeader "Location","http://www.xxxx.com/"
Response.End
end if
404设置(根据根目录下的文件设置)
骑士互联http://www.74dns.com
301设置(在根目录下放文件httpd.ini)
文件代码代码
[ISAPI_Rewrite]
CacheClockRate 3600
RepeatLimit 32
RewriteCond Host: ^xxxx.net$
RewriteRule (.*) http://www.xxxx.net$1 [I,RP]
404设置(根据网站目录下文件情况)
广深互联http://www.99idc.cn/
301设置
web.config文件的代码如下 :
<?xml version="1.0" encoding="UTF-8"?>
<configuration>
<system.webServer>
<rewrite>
<rules>
<rule name="CanonicalHostNameRule1">
<match url="(.*)"/>
<conditions>
<add input="{HTTP_HOST}" pattern="^www.sanyoushun.com$"
negate="true"/>
</conditions>
<action type="Redirect" url="http://www.sanyoushun.com/{R:1}"/>
</rule>
</rules>
</rewrite>
</system.webServer>
</configuration>
404设置(与骑士一样)
网址规范化指的是搜索引擎挑选合适的URL作为真正(规范化的)网址的过程。
一、首先,为什么会出现不规范网址?
如图所示:
http://maxseo.cn
http://www.maxseo.cn
http://www.maxseo.cn/index.html
http://maxseo.cn/index.html
上面这几个URL指的是同一个文件:首页
从技术上来说,这几个URL都是不同的网址,搜索引擎也确实把他当作不同的网址,虽然这些网址返回的都是相同的文件,也就是首页。但从技术上来说:主机完全可以对这几个网址返回不同的内容。那么,除了图上带与不带www造成的,以及结尾是否带有index.html后缀造成的不规范网址外,其实还有以下几种原因会造成。例如:
①:网站程序的原因,不少CMS系统经常出现一篇文章可以通过几种不同的URL去访问。
②:URL静态化设置存在错误,同一篇文章中有多个静态化URL可以访问。如图(截图URL和访问的标题):
③:URL静态化后,静态和动态URL共存,都有链接,也都可以访问。
④:网站的目录后带与不带斜杠。如图:
下图为不同的网址,但其实是一个页面。
http://www.baidu.com
http://www.baidu.com/
⑤:加密网址。如图:
下图的URL同时存在,但都可以访问。
http://www.baidu.com
https://www.baidu.com
⑥:URL中有端口号。如图:
http://www.baidu.com80/
http://www.baidu.com/
⑦:跟踪代码。有喜欢做网络推广的人,习惯在URL后面加跟踪代码。如图:
http://www.baidu.com/?*100
二:其次,出现网址不规范会给网站带来什么问题?
网站出现多个不规范网址会给搜索引擎收录和排名带来很多的麻烦,为什么不规范的URL会给搜索引擎和排名带来很多麻烦?为了让站长彻底的明白,我们举个例子,比如:网站首页是固定的且只有一个,但很多站长在链接回首页的时候所使用的URL并不是的,而是一会连到http://www.esobao.cn,一会连到http://www.esobao.cn/index.html。
一般来说,虽然不会给用户造成什么麻烦,但因为这些网址都是同一个文件,会间接性的给搜索引擎造成困惑,搜索引擎会认为:到底哪一个网址才是真正的首页?哪一个网址应该被当作首页返回?那么,这里有个重点:如果网站上不同版本的网址同时出现,就会很可能被搜索引擎收录。被收录之后,后果就可想而知了。而此时,搜索引擎在计算排名的时候必须要找到所谓规范化的网址,也就是搜索引擎认为的合适的URL版本。
不规范化会造成的问题,笔者简单的来说下:
①: 网站上有多个URL,这样会分散页面权重,不利于排名。
②:搜索引擎判断的规范化网址并不是站长想要的那个网址。如图(站长想要的是不带后缀的,搜索引擎去把带后缀的给收录了):
③:如果网址规范化问题太严重,也可能影响收录。因为:一个权重不是很高的域名,能收录的总页面数和蜘蛛总爬行时间是有限的,而搜索引擎把资源花在收录不规范的网址上,留给独特内容的资源就变得越来越少了。
④:重复页面过多,搜索引擎可能认为有作弊嫌疑。
⑤:对于搜索引擎来说,浪费资源、浪费宽带。
三、后,如何解决网址规范化的问题
关于如何解决网址规范化问题,可能这个对于站长而言是重点也是核心内容了。那么,可以解决URL规范化问题的方法有很多,比如接下来我们要说的这些:
①:现在企业、个人站长用的程序多的就是CMS,那么此时你就要确定你使用的这个CMS系统是否只能产生规范化网址,无论是否有静态化,比如DEDE、帝国CMS等。
②:所有内链要保持统一,都指向规范化网址。比如:以带与不带www为例子,确定一个版本为规范化网址后,网站的内部链接都要统一使用这个版本,这样搜索引擎就会明白哪一个是站长希望的网站规范化网址。而从用户体验的角度去看:用户通常选择就是带www的版本为规范化网址。
③:301转向。这个常用也是普遍的一个方法,站长可以通过301转向把不规范化URL全部转向到规范化URL。
④:canonical标签。目前也是站长使用比较多的一种了,而且百度也是全面支持这个标签了。
⑤:制作XML地图,地图中全部使用规范化网址,然后提交给搜索引擎。
虽然方法很多,但很多方法都有局限性,比如:有的网站因为技术的缺失或不成熟,导致301无法实现。再比如:很多CMS系统经常无法受自己控制等等。那么,笔者这里主要针对301和canonical做下具体的说明,因为这两种规范化方式是站长常用的手段,而且也是百度认同的。