关键词布局策略
对于大多数SEOer来说,做网站优化就是做关键词排名,在关键词优化中,关键词的布局应该是我们seo优化人员应该优先考虑的一点。要想使网站排名稳定上升,必须站内+站外同步做起。竞争力不大的关键词,通过外链便可以把词做起来,再通过高质量的友情链接便可以使排名稳定,至于网站中比较难做、竞争力度很大的关键词就必须从网站的内部开始优化,同时还要从外部建立链接资源。下面是关于网站优化中的关键词布局。
关键词的布局
一、网站整体的关键词布局
当我们拿到一个站时,首先要考虑的就是关键词的布局。其中包含核心关键词,目标关键词,长尾关键词的分布情况。并不是把所有要优化的词都放在首页,什么核心关键词放首页啦,目标词放在栏目页啦,长尾词放在内容页啦,这些都要合理的布局。
二、首页、栏目页的关键词布局
下面我们先来分析一下网站的META标签:title,keywords,description上的关键词布局:
1、title出现的关键词不宜过多,尽量控制在四个之内,主要的关键词放在左边,按照优先级排下去。关键词之间可以通过“-”、“|”、“,”这些符号隔开,效果是差不多的按照个人喜好运用即可。并且核心关键词出现的越早越好。对于中小型网站来说用关键词_网站名称的做法是比较合理的。
2、Keywords,就是关键词,现在的主流搜索引擎都不再依靠中的关键字了,因此,这部分内容我们也只是“例行公事”,个人觉得意义不大,不过总好过没有。
3、Description,就是描述,应该用近乎描述的语言写下一段介绍你网站的文字,在这其中,你应该适当的对你网站的特色内容加以重复以求突出。
4、在页面中多次出现这个关键词,并在次出现时,加粗或者用H1标签进行标注。核心关键词应该尽早的出现在页面中,这样搜索引擎会才会认为这个网页是围绕这个关键词来组织内容的,指导搜索引擎来确定网页的关键词,这里多说一句,搜索引擎并不会直接把keywords中出现的词作为网页的关键词来处理,而是根据网页的内容来提取的。
5、首页关键词注意事项:避免堆砌,有许多站长喜欢在页面底部加上自己网站的核心关键词锚文本,并进行加粗,这点我们认为是不可取的,有不利的嫌疑,虽然搜索引擎不一定这么判定,但是我们要基于用户的角度出发,这里放置这些关键词锚文本用户是不会有点击欲望的,我们可以把核心关键词作为导航或者栏目,形成自然的锚文本,而不是在页面底部进行堆砌。
三、文章页的关键词布局
我们的内页和目录页一般都是用来优化长尾关键词,其实内页的关键词布局和首页基本差不多,首页一般是综合性的,而内页一般都是一篇文章或者产品或者新闻。那么内页的正文部分就要考虑到关键词的布局。一般我们写文章都按照总-分-总的布局来写,那么在总的部分,要集中关键词并加以总结,中间部分的内容围绕着关键词来合理布局,后针对关键词做总结自然的包含了目标关键词。
在此再提醒大家一点:内页部分要在合理的位置放置首页核心关键词的锚文本,一般情况下放且只放置一个核心关键词的锚文本链接到首页,目的是增加首页核心关键词的权重提高首页关键词排名,前提是要合理,不可强行安插,如果文章并没有必要放置的情况下,我们不建议放置这个锚文本。
以上所说的就是个人对关键词布局的总体看法,相信大家也都有自己的一套关键词布局方法。或许有博友会问,总体的布局好了,那平时发布文章时,关键词该怎么布局呢?比如:关键词密度、关键词位置设定等等。跟大家分享一下网站后期关键词布局优化的五点技巧:
一、通过文章编辑,让文章中自然出现关键词
百度搜索引擎和谷歌搜索引擎都在2012年对搜索引擎的算法进行了较大变革,有些网站因为这次变革收录量得到了大幅度的增加,这是对网站内容之前关键词布局的肯定,也是对以后网站关键词布局的一种指导,就是说每一篇容都合理的布局应该出现的关键词密度,让搜索引擎认为文章中的关键词出现是自然的,为网站的关键词进一步优化布局提供有利条件。
二、合理布局关键词出现位置,让关键词被搜索引擎抓取
不同的网站都有着不同的关键词,而合理的布局这些关键词位置就显得尤为重要,对于普通的网站来说,网站关键词出现的位置与网站优化息息相关,对于搜索引擎蜘蛛来说关键词出现的位置应该是有利于抓取的位置,而网站中有利于搜索引擎蜘蛛抓取的位置应该是网站的顶部与左部,可以合理的在这两个方向进行合理的关键词设置,网站关键词被搜索引擎抓取得越多,而其他内容也存在,这就可以为网站提高关键词排名起到促进作用。
三、文章内部链接布局具备相关性,助力网站优化
或许很多站长都做过这件事情,在写文章的时候往往都会出现另外一个网站的链接,而这些网站的链接大多都是不相关的,而这种布局关键词链接就出现了错误,不管是带上的超链接还是纯文本链接,首先关键词就要符合相关性,而链接中指向的内容也必须符合相关性,只有通过加强相关性的方法才能够自己的网站获得搜索引擎的重视,而搜索引擎也会认为你的网站受到了其他站点的支持,这对网站的优化会起到意想不到的作用。
四、以用户为基础编辑网站关键词,创建高效用户体验
网站关键词的选择并不一定要用行业的热门词,真正的关键词应该是符合用户体验为主的词语,比如seo这个词,很多用户在搜索的时候并不一定是搜索seo,而更多的应该是搜索如何学习seo,因此我们在关键词的布局之上就 要像如何学习seo、怎么学习seo进行倾斜,要满足用户的需求,以用户为基础编辑网站的关键词,而不是以自我为中心或者以行业为中心撰写网站关键词。
五、文章标题一定带关键词,但一篇文章好只带一个关键词
很多时候大家写文章都是随便写作,其实真正的文章应该在文章标题中就带上关键词,标题带关键词能够帮助搜索引擎直接抓取关键词,大家都知道搜索引擎在抓取的过程中不一定是将你的文章内容全部抓取,所以我们的标题带关键词就可以为网站的排名提升创造基础,如果你将关键词放在文章内容里面,而搜索引擎又不进行抓取,那么这样的文章是不是就浪费了,写文章的目的是什么?就是为了有排名,有流量。如果连这点都不去关注的话,那就是浪费了文章资源了。
SEO经验之谈:
当网站内容都经过了细致的关键词布局之后,你就会发现网站的收录量逐渐增加,网站关键词排名也会大幅的提高,但有时一些长尾词会有下降的情况,这些起伏都是正常的,不用过多担心。
要注意的是文件的相关性不仅仅是由页面本身来决定的,还有包括链接分析,域名被信任度等等其他因素。
针对关键词的页面优化
关键词密度
网站首页文字不能太多,与关键词相比而言,文字多,不好控制关键词密度,特别是做网站时,一些固定位置的选择,比如导航,栏目,底部,图片属性,这些位置的关键词或许是固定的。好控制的就是文章标题了,如果标题中关键词突出,那密度就突然增高,如果文章标题没有包括关键词,那密度就会低,排名可能也会随着变化。常见的就是cms网站,首页文章多,一般都需要增加关键词密度。
关键词密度控制在2%-8%为佳
关键字密度就是我们所强调的关键词在网页中出现的次数与网页中其它文本内容的比例。相对于页面总字数而言,关键字出现的次数越多,那么总的关键字密度也就越大。关键词密度一般在2%-8%效果为好。既然强调的是次数,那肯定少了说明主题不突出,多了属于关键词堆积。关键词出现在哪些位置能提高关键词排名呢,关键词密度低了高了对排名有什么影响呢。
标题中出现关键词过多真的好吗
我们在选择关键词的时候,都会从标题关键词的设置开展整个页面的关键词设置,很多朋友都认为标题中多放几个关键词效果会好些,能展现在搜索排名中,强调关键词,那是以前搜素引擎不智能,现在搜索引擎看到这些会比较反感,特别是标题堆积一些广泛的词,标题长度过长,导致标题中关键词密度降低,同样得不到好的排名,更不用说流量。标题中同个关键词出现多不要出现3次,且有修饰成分。
比如要设“网站建设”关键字,标题“网站建设,苏州网站建设,苏州网站建设公司”这样网站建设的密度在标题中就很高,且主题突出。标题中不要掺杂其他干扰成分,干脆利落,也不要把长长的公司名称放在后面或者前面,字数越少越好。
关键词与描述标签中的关键词密度也要控制
关键词标签中的关键词也不能太多,可以把标题中的几个关键词作为关键词即可,这个位置可以多放几个,是标题的扩展,可以在放几个与标题相关的长尾词,这个不多说。主要说下描述,描述不是随便放几个关键词就完事,他是一段说明,相当于公司的简介,这个站是做什么的,搜索引擎首先通过它来了解,如果这段描述不出现在搜索引擎搜索排名中标题的下面,说明你设置的就有问题。描述可以把关键词标签设置的几个词放进去,在组成合理的句子,不通顺,少加不需要的词,长度也控制在150字左右。
HTML标签
关键词应该出现在网页标题标签里面,标题标签Title Tag是目前很重要的一个因素,应该包含你重要的关键词。
另外在描述标签Description Tag,关键词标签Keyword Tag,图像ALT标签都可以放入关键词,但注意不要关键词堆砌。
关键词在网页正文中
只要你正常的写文章,关键词必然会出现在文章正文中。好把关键词放在正文标题heading,H1-H3比普通文字有高一点的权重,这也很有逻辑性,因为标题自然是这篇文章应该讨论的内容。
另外可以用黑体,斜体来强调关键词,但一两次就够了。
可以在正文的前面,也就是段句话放入关键词,这也是一个比较重要的因素。
还可以在网页底部放上关键词,当然要符合逻辑和语法,并对用户友好。
URL中的关键词
对英文网页来说,关键词出现在URL中,多少会有点帮助。对搜索引擎相关性算法的帮助可能很小,但其实对用户帮助蛮大的。因为搜索结果列在搜索引擎中时,用户可以从你的文件名就判断出这个网页是讨论什么的。
关键词可以在域名里,也可以在目录名里,也可以是文件名,不过切忌关键词堆砌在URL中。
关键词出现在链接中
关键词应该出现在网页导出链接的链接文字中,这是相当重要的一方面。其实在某种程度上来说,导出链接中含有的关键词,比连向这个网页的外部链接中的关键词还重要。
不仅是在你网站内部互相链接的时候需要以关键词为链接文字,也应该在文章中经常引用和指向其他相关文件,并以关键词为链接文字。
搜索引擎抓取系统概述(一)
编者按:站长朋友们,今后定期都将在这里跟大家分享一些有关搜索引擎工作原理及网站运营相关的内容,今天先简单介绍一下关于搜索引擎抓取系统中有关抓取系统基本框架、抓取中涉及的网络协议、抓取的基本过程三部分。
互联网信息爆发式增长,如何有效的获取并利用这些信息是搜索引擎工作中的首要环节。数据抓取系统作为整个搜索系统中的上游,主要负责互联网信息的搜集、保存、更新环节,它像蜘蛛一样在网络间爬来爬去,因此通常会被叫做“spider”。例如我们常用的几家通用搜索引擎蜘蛛被叫做:Baiduspdier、Googlebot、Sogou Web Spider等。
Spider抓取系统是搜索引擎数据来源的重要,如果把web理解为一个有向图,那么spider的工作过程可以认为是对这个有向图的遍历。从一些重要的种子 URL开始,通过页面上的超链接关系,不断的发现新URL并抓取,尽大可能抓取到更多的有价值网页。对于类似百度这样的大型spider系统,因为每时 每刻都存在网页被修改、删除或出现新的超链接的可能,因此,还要对spider过去抓取过的页面保持更新,维护一个URL库和页面库。
1、spider抓取系统的基本框架
如下为spider抓取系统的基本框架图,其中包括链接存储系统、链接选取系统、dns解析服务系统、抓取调度系统、网页分析系统、链接提取系统、链接分析系统、网页存储系统。
2、spider抓取过程中涉及的网络协议
搜索引擎与资源提供者之间存在相互依赖的关系,其中搜索引擎需要站长为其提供资源,否则搜索引擎就无法满足用户检索需求;而站长需要通过搜索引擎将自己的 内容推广出去获取更多的受众。spider抓取系统直接涉及互联网资源提供者的利益,为了使搜素引擎与站长能够达到双赢,在抓取过程中双方必须遵守一定的 规范,以便于双方的数据处理及对接。这种过程中遵守的规范也就是日常中我们所说的一些网络协议。以下简单列举:
http协议:超文本传输协议,是互联网上应用为广泛的一种网络协议,客户端和服务器端请求和应答的标准。客户端一般情况是指终端用户,服务器端即指网 站。终端用户通过浏览器、蜘蛛等向服务器指定端口发送http请求。发送http请求会返回对应的httpheader信息,可以看到包括是否成功、服务 器类型、网页近更新时间等内容。
https协议:实际是加密版http,一种更加安全的数据传输协议。
UA属性:UA即user-agent,是http协议中的一个属性,代表了终端的身份,向服务器端表明我是谁来干嘛,进而服务器端可以根据不同的身份来做出不同的反馈结果。
robots协议:robots.txt是搜索引擎访问一个网站时要访问的个文件,用以来确定哪些是被允许抓取的哪些是被禁止抓取的。 robots.txt必须放在网站根目录下,且文件名要小写。详细的robots.txt写法可参考 http://www.robotstxt.org 。百度严格按照robots协议执行,另外,同样支持网页内容中添加的名为robots的meta标 签,index、follow、nofollow等指令。
3、spider抓取的基本过程
spider的基本抓取过程可以理解为如下的流程图:
4.spider抓取过程中的策略
spider在抓取过程中面对着复杂的网络环境,为了使系统可以抓取到尽可能多的有价值资源并保持系统及实际环境中页面的一致性同时不给网站体验造成压力,会设计多种复杂的抓取策略。以下简单介绍一下抓取过程中涉及到的主要策略类型:
1、抓取友好性:抓取压力调配降低对网站的访问压力
2、常用抓取返回码示意
3、多种url重定向的识别
4、抓取优先级调配
5、重复url的过滤
6、暗网数据的获取
7、抓取反作弊
8、提高抓取效率,高效利用带宽
1、抓取友好性
互联网资源庞大的数量级,这就要求抓取系统尽可能的高效利用带宽,在有限的硬件和带宽资源下尽可能多的抓取到有价值资源。这就造成了另一个问题,耗费被抓网站的带宽造成访问压力,如果程度过大将直接影响被抓网站的正常用户访问行为。因此,在抓取过程中就要进行一定的抓取压力控制,达到既不影响网站的正常用户访问又能尽量多的抓取到有价值资源的目的。
通常情况下,基本的是基于ip的压力控制。这是因为如果基于域名,可能存在一 个域名对多个ip(很多大网站)或多个域名对应同一个ip(小网站共享ip)的问题。实际中,往往根据ip及域名的多种条件进行压力调配控制。同时,站长平台也推出了压力反馈工具,站长可以人工调配对自己网站的抓取压力,这时百度spider将优先按照站长的要求进行抓取压力控制。
对同一个站点的抓取速度控制一般分为两类:其一,一段时间内的抓取频率;其二,一段时间内的抓取流量。同一站点不同的时间抓取速度也会不同,例如夜深人静月黑风高时候抓取的可能就会快一些,也视具体站点类型而定,主要思想是错开正常用户访问高峰,不断的调整。对于不同站点,也需要不同的抓取速度。
2、常用抓取返回码示意
简单介绍几种百度支持的返回码:
1) 常见的404代表“NOT FOUND”,认为网页已经失效,通常将在库中删除,同时短期内如果spider再次发现这条url也不会抓取;
2) 503代表“Service Unavailable”,认为网页临时不可访问,通常网站临时关闭,带宽有限等会产生这种情况。对于网页返回503状态码,百度spider不会把这条url直接删除,同时短期内将会反复访问几次,如果网页已恢复,则正常抓取;如果继续返回503,那么这条url仍会被认为是失效链接,从库中删除。
3) 403代表“Forbidden”,认为网页目前禁止访问。如果是新url,spider暂时不抓取,短期内同样会反复访问几次;如果是已收录url,不会直接删除,短期内同样反复访问几次。如果网页正常访问,则正常抓取;如果仍然禁止访问,那么这条url也会被认为是失效链接,从库中删除。
4)301 代表是“Moved Permanently”,认为网页重定向至新url。当遇到站点迁移、域名更换、站点改版的情况时,我们使用301返回码,同时使用站长平台网站改版工具,以减少改版对网站流量造成的损失。
3、多种url重定向的识别
互联网中一部分网页因为各种各样的原因存在url重定向状态,为了对这部分资源正常抓取,就要求spider对url重定向进行识别判断,同时防止作弊行为。重定向可分为三类:http 30x重定向、meta refresh重定向和js重定向。另外,百度也支持Canonical标签,在效果上可以认为也是一种间接的重定向。
4、抓取优先级调配
由于互联网资源规模的巨大以及迅速的变化,对于搜索引擎来说全部抓取到并合理的更新保持一致性几乎是不可能的事情,因此这就要求抓取系统设计一套合理的抓取优先级调配策略。主要包括:深度优先遍历策略、宽度优先遍历策略、pr优先策略、反链策略、社会化分享指导策略等等。每个策略各有优劣,在实际情况中往往是多种策略结合使用以达到优的抓取效果。
5、重复url的过滤
spider在抓取过程中需要判断一个页面是否已经抓取过了,如果还没有抓取再进行抓取网页的行为并放在已抓取网址集合中。判断是否已经抓取其中涉及到核心的是快速查找并对比,同时涉及到url归一化识别,例如一个url中包含大量无效参数而实际是同一个页面,这将视为同一个url来对待。
6、暗网数据的获取
互联网中存在着大量的搜索引擎暂时无法抓取到的数据,被称为暗网数据。一方面,很多网站的大量数据是存在于网络数据库中,spider难以采用抓取网页的方式获得完整内容;另一方面,由于网络环境、网站本身不符合规范、孤岛等等问题,也会造成搜索引擎无法抓取。目前来说,对于暗网数据的获取主要思路仍然是通过开放平台采用数据提交的方式来解决,例如“百度站长平台”“百度开放平台”等等。
7、抓取反作弊
spider在抓取过程中往往会遇到所谓抓取黑洞或者面临大量低质量页面的困扰,这就要求抓取系统中同样需要设计一套完善的抓取反作弊系统。例如分析url特征、分析页面大小及内容、分析站点规模对应抓取规模等等。