robots.txt文件详细解说
1. 什么是robots.txt文件?
搜索引擎使用spider程序自动访问互联网上的网页并获取网页信息。spider在访问一个网站时,会首先会检查该网站的根域下是否有一个叫做 robots.txt的纯文本文件,这个文件用于指定spider在您网站上的抓取范围。您可以在您的网站中创建一个robots.txt,在文件中声明 该网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。
请注意,仅当您的网站包含不希望被搜索引擎收录的内容时,才需要使用robots.txt文件。如果您希望搜索引擎收录网站上所有内容,请勿建立robots.txt文件。
2. robots.txt文件放在哪里?
robots.txt文件应该放置在网站根目录下。举例来说,当spider访问一个网站(比如 http://www.abc.com)时,首先会检查该网站中是否存在http://www.abc.com/robots.txt这个文件,如果 Spider找到这个文件,它就会根据这个文件的内容,来确定它访问权限的范围。
网站 URL | 相应的 robots.txt的 URL |
http://www.esobao.cn/ | http://www.esobao.cn/robots.txt |
http://www.esobao.cn:80/ | http://www.esobao.cn:80/robots.txt |
http://www.esobao.cn:1234/ | http://www.esobao.cn:1234/robots.txt |
http://esobao.cn/ | http://esobao.cn/robots.txt |
3. 我在robots.txt中设置了禁止百度收录我网站的内容,为何还出现在百度搜索结果中?
如果其他网站链接了您robots.txt文件中设置的禁止收录的网页,那么这些网页仍然可能会出现在百度的搜索结果中,但您的网页上的内容不会被抓取、建入索引和显示,百度搜索结果中展示的仅是其他网站对您相关网页的描述。
4. 禁止搜索引擎跟踪网页的链接,而只对网页建索引
如果您不想搜索引擎追踪此网页上的链接,且不传递链接的权重,请将此元标记置入网页的<HEAD> 部分:
<meta name="robots" content="nofollow">
如果您不想百度追踪某一条特定链接,百度还支持更的控制,请将此标记直接写在某条链接上:
<a href="signin.php" rel="nofollow">signin</a>
要允许其他搜索引擎跟踪,但仅防止百度跟踪您网页的链接,请将此元标记置入网页的<HEAD> 部分:
<meta name="Baiduspider" content="nofollow">
5. 禁止搜索引擎在搜索结果中显示网页快照,而只对网页建索引
要防止所有搜索引擎显示您网站的快照,请将此元标记置入网页的<HEAD>部分:
<meta name="robots" content="noarchive">
要允许其他搜索引擎显示快照,但仅防止百度显示,请使用以下标记:
<meta name="Baiduspider" content="noarchive">
注:此标记只是禁止百度显示该网页的快照,百度会继续为网页建索引,并在搜索结果中显示网页摘要。
6. 我想禁止百度图片搜索收录某些图片,该如何设置?
禁止Baiduspider抓取网站上所有图片、禁止或允许Baiduspider抓取网站上的某种特定格式的图片文件可以通过设置robots实现,请参考“robots.txt文件用法举例”中的例10、11、12。
7. robots.txt文件的格式
"robots.txt"文件包含一条或更多的记录,这些记录通过空行分开(以CR,CR/NL, or NL作为结束符),每一条记录的格式如下所示:
"<field>:<optional space><value><optionalspace>"
在该文件中可以使用#进行注解,具体使用方法和UNIX中的惯例一样。该文件中的记录通常以一行或多行User-agent开始,后面加上若干Disallow和Allow行,详细情况如下:
User-agent:
该项的值用于描述搜索引擎robot的名字。在"robots.txt"文件中,如果有多条User-agent记录说明有多个robot会受 到"robots.txt"的限制,对该文件来说,至少要有一条User-agent记录。如果该项的值设为*,则对任何robot均有效, 在"robots.txt"文件中,"User-agent:*"这样的记录只能有一条。如果在"robots.txt"文件中,加入"User- agent:SomeBot"和若干Disallow、Allow行,那么名为"SomeBot"只受到"User-agent:SomeBot"后面的 Disallow和Allow行的限制。
Disallow:
该项的值用于描述不希望被访问的一组URL,这个值可以是一条完整的路径,也可以是路径的非空前缀,以Disallow项的值开头的URL不会被 robot访问。例如"Disallow:/help"禁止robot访问/help.html、/helpabc.html、/help /index.html,而"Disallow:/help/"则允许robot访问/help.html、/helpabc.html,不能访问 /help/index.html。"Disallow:"说明允许robot访问该网站的所有url,在"/robots.txt"文件中,至少要有一条Disallow记录。如果"/robots.txt"不存在或者为空文件,则对于所有的搜索引擎robot,该网站都是开放的。
Allow:
该项的值用于描述希望被访问的一组URL,与Disallow项相似,这个值可以是一条完整的路径,也可以是路径的前缀,以Allow项的值开头 的URL 是允许robot访问的。例如"Allow:/hibaidu"允许robot访问/hibaidu.htm、/hibaiducom.html、 /hibaidu/com.html。一个网站的所有URL默认是Allow的,所以Allow通常与Disallow搭配使用,实现允许访问一部分网页同时禁止访问其它所有URL的功能。
使用"*"and"$":
Baiduspider支持使用通配符"*"和"$"来模糊匹配url。
"$" 匹配行结束符。
"*" 匹配0或多个任意字符。
注:我们会严格遵守robots的相关协议,请注意区分您不想被抓取或收录的目录的大小写,我们会对robots中所写的文件和您不想被抓取和收录的目录做匹配,否则robots协议无法生效。
8. URL匹配举例
Allow或Disallow的值 | URL | 匹配结果 |
/tmp | /tmp | yes |
/tmp | /tmp.html | yes |
/tmp | /tmp/a.html | yes |
/tmp | /tmphoho | no |
/Hello* | /Hello.html | yes |
/He*lo | /Hello,lolo | yes |
/Heap*lo | /Hello,lolo | no |
html$ | /tmpa.html | yes |
/a.html$ | /a.html | yes |
htm$ | /a.html | no |
9. robots.txt文件用法举例
例1. 禁止所有搜索引擎访问网站的任何部分 | User-agent: * |
例2. 允许所有的robot访问 | User-agent: * |
例3. 仅禁止Baiduspider访问您的网站 | User-agent: Baiduspider |
例4. 仅允许Baiduspider访问您的网站 | User-agent: Baiduspider |
关键词:
没有了!
没有了!
3.8.1.6关键词竞争度分析 1.关键词研究分析 1)为什么要研究关键词? 1.确保目标关键词有人搜索;2.降低优化难度;3.寻找有效流量;4.搜索多样性;5.发现新机会; 关键词分析包括:关键词选择前期的竞争度分析,以及编辑内容时的趋势分析和需求分析,后的关键词排名及以后的转换率分析。详细内容如下: 2)关键词竞争度分析 关键词竞争度分析就是分析这个关键词在行业排名的难易程度以及估算排名时间。关键词竞争度分析主要有下面几个方面: (1)关键词搜索指数 指数越高说明每天的搜索量越大,那么竞争度肯定越高。你想每天有这么所的搜索那就会有更多的网站想要截获这一批流量,当然竞争也会越大。也有指数很高但是却很少有专门的网站要去做这个关键词,如果这样的关键词被你发现了,那就赶紧做吧,你能获取很多的流量。 (2)关键词的商业价值 一些关键词的商业价值很高,很多企业愿意花钱做推广,当然也有更多的人想方设法做上自然排名。通常这样的关键词百度排名首页有7-8个以上的百度推广链接,基本上搜索这个关键词的用户被这些推广链接截取了。就算你的网站排名在自然排名的位也获取不了很多的流量,这就是商业词的特点。比如“整形美容”这样的词就是极具商业价值的词。 (3)位于首页网站的质量 搜索关键词看位于首页网站的质量,如果首页的网站是大型网站的首页或者内容,或者是高权重网站的首页,这样的关键词做上首页的排名会比较困难。而那种搜索第二页就出现企业站内页的关键词排名竞争度比较低,做上排名的时间比较短。 2、关键词趋势分析 关键词需求分析要结合百度相关搜索、下拉框和百度指数。相关搜索是一个月左右的搜索量,而下拉框是近1-2周的搜索量,如果相关搜索里面有一些词没有,而下拉框里面很有可能在未来的一个月这个关键词的需求会增加。 百度指数有的需求图谱给出了相关检索词和上升快检索词,如果想要网站在之后的一两个月有好的排名内容里面一定要有上升快检索词的内容。快检索词里面的关键词需要经常进行关注,不断更新快检索词的内容。 3、关键词需求分析 关键词需求分析就是分析搜索这个关键词的用户需要哪些内容,做需求分析的目的就是全面了解用户需求从而满足,如此便把用户留住在你的网页。需求分析方法如下: (1)分析下拉框和相关搜索。一些竞争度大的长尾词也有下拉词和相关搜索词,比如”斗式提升机型号“这个词,潜在需求就是把不同斗式提升机型号做一个表格,然后不同型号不同的功能运用。 (2)分析潜在需求。潜在需求是用户没有说出来的需求,搜索引擎也没有说出来,那么这个需求怎么满足呢?比如”SEO是什么“这个长尾词,”SEO是什么“是”SEO“的长尾词,而搜索”SEO“在下拉框里面出现SEO教程。所有人都知道,只要出现教程,那么肯定肯视频有关系,所以在做”SEO是什么“时可以用视频加文字的形式来做。 4、关键词转换率分析 转换率分析需要借助工具完成,比如百度商桥、百度推广等,百度商桥是好的转换率记录工作,如果没有百度商桥就采用客服询问的方式或者结合统计后台的方式: (1)客服询问,客服问客户是通过搜索哪个关键词进入网站的。 (2)结合百度统计后台以及咨询时间可以获取用户搜索信息。 (3)百度商桥能记录用户通过什么关键词搜索进来的以及浏览了哪些页面等。 综上所述个人建议就是把关键词需求分析做到好才可以获得好排名。 |