URL规范化

作者:鼎极网络发布日期:2019-11-13浏览次数:6

  网址规范化指的是搜索引擎挑选合适的URL作为真正(规范化的)网址的过程。

  一、首先,为什么会出现不规范网址?

  如图所示:

  http://maxseo.cn

  http://www.maxseo.cn

  http://www.maxseo.cn/index.html

  http://maxseo.cn/index.html

  上面这几个URL指的是同一个文件:首页

  从技术上来说,这几个URL都是不同的网址,搜索引擎也确实把他当作不同的网址,虽然这些网址返回的都是相同的文件,也就是首页。但从技术上来说:主机完全可以对这几个网址返回不同的内容。那么,除了图上带与不带www造成的,以及结尾是否带有index.html后缀造成的不规范网址外,其实还有以下几种原因会造成。例如:

  ①:网站程序的原因,不少CMS系统经常出现一篇文章可以通过几种不同的URL去访问。

  ②:URL静态化设置存在错误,同一篇文章中有多个静态化URL可以访问。如图(截图URL和访问的标题):

  

1.png

  

2.png

  

3.png

  ③:URL静态化后,静态和动态URL共存,都有链接,也都可以访问。

  ④:网站的目录后带与不带斜杠。如图:

  下图为不同的网址,但其实是一个页面。

  http://www.baidu.com

  http://www.baidu.com/

  ⑤:加密网址。如图:

  下图的URL同时存在,但都可以访问。

  http://www.baidu.com

  https://www.baidu.com

  ⑥:URL中有端口号。如图:

  http://www.baidu.com80/

  http://www.baidu.com/

  ⑦:跟踪代码。有喜欢做网络推广的人,习惯在URL后面加跟踪代码。如图:

  http://www.baidu.com/?*100

  二:其次,出现网址不规范会给网站带来什么问题?

  网站出现多个不规范网址会给搜索引擎收录和排名带来很多的麻烦,为什么不规范的URL会给搜索引擎和排名带来很多麻烦?为了让站长彻底的明白,我们举个例子,比如:网站首页是固定的且只有一个,但很多站长在链接回首页的时候所使用的URL并不是的,而是一会连到http://www.esobao.cn,一会连到http://www.esobao.cn/index.html。

  一般来说,虽然不会给用户造成什么麻烦,但因为这些网址都是同一个文件,会间接性的给搜索引擎造成困惑,搜索引擎会认为:到底哪一个网址才是真正的首页?哪一个网址应该被当作首页返回?那么,这里有个重点:如果网站上不同版本的网址同时出现,就会很可能被搜索引擎收录。被收录之后,后果就可想而知了。而此时,搜索引擎在计算排名的时候必须要找到所谓规范化的网址,也就是搜索引擎认为的合适的URL版本。

  不规范化会造成的问题,笔者简单的来说下:

  ①: 网站上有多个URL,这样会分散页面权重,不利于排名。

  ②:搜索引擎判断的规范化网址并不是站长想要的那个网址。如图(站长想要的是不带后缀的,搜索引擎去把带后缀的给收录了):

  

4.png

  ③:如果网址规范化问题太严重,也可能影响收录。因为:一个权重不是很高的域名,能收录的总页面数和蜘蛛总爬行时间是有限的,而搜索引擎把资源花在收录不规范的网址上,留给独特内容的资源就变得越来越少了。

  ④:重复页面过多,搜索引擎可能认为有作弊嫌疑。

  ⑤:对于搜索引擎来说,浪费资源、浪费宽带。

  三、后,如何解决网址规范化的问题

  关于如何解决网址规范化问题,可能这个对于站长而言是重点也是核心内容了。那么,可以解决URL规范化问题的方法有很多,比如接下来我们要说的这些:

  ①:现在企业、个人站长用的程序多的就是CMS,那么此时你就要确定你使用的这个CMS系统是否只能产生规范化网址,无论是否有静态化,比如DEDE、帝国CMS等。

  ②:所有内链要保持统一,都指向规范化网址。比如:以带与不带www为例子,确定一个版本为规范化网址后,网站的内部链接都要统一使用这个版本,这样搜索引擎就会明白哪一个是站长希望的网站规范化网址。而从用户体验的角度去看:用户通常选择就是带www的版本为规范化网址。

  ③:301转向。这个常用也是普遍的一个方法,站长可以通过301转向把不规范化URL全部转向到规范化URL。

  ④:canonical标签。目前也是站长使用比较多的一种了,而且百度也是全面支持这个标签了。

  ⑤:制作XML地图,地图中全部使用规范化网址,然后提交给搜索引擎。

  虽然方法很多,但很多方法都有局限性,比如:有的网站因为技术的缺失或不成熟,导致301无法实现。再比如:很多CMS系统经常无法受自己控制等等。那么,笔者这里主要针对301和canonical做下具体的说明,因为这两种规范化方式是站长常用的手段,而且也是百度认同的。

关键词:

  长尾关键词流量占据全站流量的80%,长尾关键词优化主要注意长尾词挖掘、长尾词布局、长尾词页面内容编辑、长尾词推广和外链。

  

1.png

  1、长尾词挖掘可以借助百度下拉框、百度相关搜索、搜狗问问、百度知道、百度推广助手等前面介绍的关键词挖掘工具。挖掘好的关键词用电子表格保存筛选,去除重复的以及选择放在网站上的长尾词。

  2、按照长尾关键词竞争度依次布局栏目页和内页关键词。布局关键词按照首页、栏目页、内页优先等级依次布局。栏目页关键词是首页关键词的扩展,内页长尾词是栏目关键词的扩展。

  3、内容编辑。网站长尾关键词页面内容一定要是有价值的内容,能有别人没有的内容,并且能解决用户大部分问题,或者采用更多元素方便用户阅读。

  4、推广。推广的方式有很多,主要目的是让用户点击进入页面浏览,用户的点击能增加点击权重,并且促进关键词页面首页的排名。搜索引擎会把收到用户关注更多的页面更快的收录和的排名。推广方式包括QQ群、QQ邮件、QQ空间、微博、微信、软文外链等。

  5、外链。外链的作用是推广和传递权重,偏向与传递权重。网页要达到收录和排名必须要有一定的权重值,外链能从站外传递一部分权重值推动页面收录和排名。

  6、记录该关键词和其链接。在内容页面的关键词,我们称之为长尾关键词。我们建议你要有一个长尾关键词及其链接的列表。把这个关键词和其链接,记录到你的长尾关键词记录单里,以方便其他发其他文章时锚文本的使用。

  7、强调关键词:

  (1)注意关键词密度,尽量在每段中都出现该关键词。

  (2)在该关键词出现的个地方,给它加黑。

  (3)文章标题,给一个H标签,可以是H1,或H2。

  (4)适当的在内容里出现一些相关关键词。

  8、写标题和关键词标签。注意,一个页面,往往只集中精力于一个关键词。一个内容页面可以实现一个关键词的,就非常好了。

  所以,内容页面的标题和关键词写法就比较简单了 例子:如果你要充分强调网站的主目标关键词,你可以把那个词放在每个页面的关键词标签里。如网站的源代码:描述标签,如果可以自定义,则针对关键词展开写80个字左右,本关键词在描述标签里重复2-3次。如不能自定义,则可以不用描述标签。

  9、相关。用户在看完你的内容后,会选择离开或继续浏览。如果你有更多精彩的内容,别忘了在文章结尾给用户。有效的相关可以减少搜索跳出率注意事项.

  通常网站内页排名是主站收录三个月以后,内页的收录周期是三个月。所以内页的标题和内容不要轻易修改,但如果推广和外链效果好会缩短内页排名周期。