词库

  网站地图

  一、什么是网站地图?

  网站地图,又称站点地图,它就是一个页面,上面放置了网站上所有页面的链接。大多数人在网站上找不到自己所需要的信息时,可能会将网站地图作为一种补救措施。搜索引擎蜘蛛非常喜欢网站地图。

  一、功能

  网站地图是一个网站所有链接的容器。很多网站的连接层次比较深,蜘蛛很难抓取到,网站地图可以方便搜索引擎蜘蛛抓取网站页面,通过抓取网站页面,清晰了解网站的架构,网站地图一般存放在根目录下并命名为sitemap,为搜索引擎蜘蛛指路,增加网站重要内容页面的收录。网站地图就是根据网站的结构、框架、内容,生成的导航网页文件。大多数人都知道网站地图对于提高用户体验有好处:它们为网站访问者指明方向,并帮助迷失的访问者找到他们想看的页面。对于SEO,网站地图的好处就更多了:

  1.为搜索引擎蜘蛛提供可以浏览整个网站的链接简单的体现出网站的整体框架出来给搜索引擎看;

  2.为搜索引擎蜘蛛提供一些链接,指向动态页面或者采用其他方法比较难以到达的页面;

  3.作为一种潜在的着陆页面,可以为搜索流量进行优化;

  4.如果访问者试图访问网站所在域内并不存在的URL,那么这个访问者就会被转到“无法找到文件”的错误页面,而网站地图可以作为该页面的“准”内容。

  二、构建技巧

  网站地图的作用非常重要,它不仅要满足访问用户的需求,还要取悦搜索引擎蜘蛛。在设计上也有一些技巧来让用户和蜘蛛都获得满意:

  1.网站地图要包含重要的一些页面

  如果网站地图包含太多链接,人们浏览的时候就会迷失。因此如果网站页面总数超过了100个的话,就需要挑选出重要的页面。建议挑选下面这些页面放到网站地图中去:

  1)产品分类页面。

  2)主要产品页面。

  3)FAQ和帮助页面。

  4)位于转化路径上的所有关键页面,访问者将从着陆页面出发,然后沿着这些页面实现转化。

  5)访问量大的前10个页面。

  6)如果有站内搜索引擎的话,就挑选出从该搜索引擎出发点击次数高的那些页面。

  2.网站地图布局一定要简洁,所有的链接都是标准的HTML文本,并且要尽可能多的包含关键字

  不要使用图片来做网站地图里的链接,这样蜘蛛就不能跟随了。一定要使用标准的HTML文本来做链接,链接中要包括尽可能多的目标关键字。比如:可以使用“无公害除草剂、杀虫剂和杀菌剂”来代替“我们的产品”为标题。

  3. 尽量在站点地图上增加文本说明

  增加文本会给蜘蛛提供更加有索引价值的内容,以及有关内容的更多线索。

  4. 在每个页面里面放置网站地图的链接

  用户一般会期望每个页面的底部都有一个指向网站地图的链接,你可以充分利用人们的这一习惯。如果网站有一个搜索栏的话,那么可以在这个搜索栏的附近增加一个指向网站地图的链接,甚至可以在搜索结果页面的某个固定位置放置网站地图的链接。

  5. 确保网站地图里的每一个链接都是正确、有效的

  如果在网站地图里出现的链接是断链和死链,对搜索引擎的影响是非常不好的。如果链接比较少,你可以把所有的链接都点一遍,以确保每一个链接是有效的。如果链接比较多,可以使用一些链接检查工具来检测。

  6. 可以把sitemap写进robots.txt里

  在引擎爬虫进来抓取网页的时候,会首先查看robots.txt、如果首先把sitemap写进robots.txt里那么在效率上会大大提高,从而获得搜索引擎的好感。

  三、生成提交

  网上有很多sitemap地图生成的方法,比如在线生成、软件生成等,sitemap地图可以提交给各大搜索引擎,从而使搜索引擎的对网站页面进行收录,我们也可以通过robots.txt来告诉搜索引擎地图的位置。将制作好的网站地图上传至网站根目录下,关键是把网站地图链接地址加入在robots文件中以及做好网站地图在页面方便蜘蛛抓取的位置,一般把网站地图放在页眉和页脚位置。

  1.普通Html格式的网站地图

  它的目的是帮助用户对站点的整体有个把握。Html格式的网站地图根据网站结构特征制定,尽量把网站的功能结构和服务内容富有条理地列出来。一般来说,网站首页有一个链接指向该格式的网站地图。

  2.XML Sitemap 通常称为Sitemap(首字母大写 S)

  简单来讲,Sitemap 就是网站上链接的列表。制作Sitemap,并提交给搜索引擎可以使网站的内容完全被收录,包括那些隐藏比较深的页面。这是一种网站与搜索引擎对话的好方式。

  四、重要性

  1、搜索引擎每天都是让蜘蛛在互联网爬行来抓取页面,网站地图的作用就是给蜘蛛爬行构造了一个方便快捷的通道,因为网站页面是一层一层的链接的,其中可能会存在死链接的情况,如果没有网站地图,蜘蛛爬行在某个页面就因死链接爬行不了,那么就不能收录那些断链接的页面,更别说快速的收录了!

  2、网站地图的存在不仅是满足搜索引擎蜘蛛的查看,更多是方便网站访客来浏览网站,特别是例如门户型网站由于信息量太多很多访客都是通过网站地图来寻找到自己需要的信息页面,这也能很好的提高用户体验度

  3、网站地图可以提高链接页面的权重,因为网站地图是指向其他页面的链接,此时网站地图就给页面增加了导入链接,大家知道导入链接的增加会影响到页面的权重,从而提高页面的权重,页面权重的提高同时会提高页面的收录率。

  五、注意要点

  真实有效

  地图的主要目的是方便搜索引擎蜘蛛抓取的,如果地图存在死链或坏链,会影响网站在搜索引擎中网站权重的,所以要仔细检查有无错误的链接地址,提交前通过站长工具,检查网站的链接是否有效。

  简化

  网站地图不要出现重复的链接,要采用标准W3C格式的地图文件,布局要简洁,清晰,如果地图是内容式地图,每页不要超过100内容个链接,采用分页的形式,逐一开来,这样方便搜索引擎蜘蛛逐页爬行。

  更新

  建议经常更新网站地图,便于培养搜索引擎蜘蛛爬行的频率。经常有新的地图内容生成,长期以来,蜘蛛就会更关注,培养蜘蛛的爬行规则。这样网站内容能更快的被搜索引擎抓取收录,网站内容也可以早日被搜索引擎检索。

  多样性

  网站地图不仅仅是给搜索引擎来看的,而SEO的根本目的也是方便浏览者,所以网站地图好兼顾搜索引擎的同时也要兼顾浏览者。我们通常为一个网站建3个网站地图。sitemap.htm 页面精美,简洁大方,让浏览者方便找到目标页面的同时也心情愉悦。.XML 认真研究自己的网站,把重要的页面标注出来,把不需要纳入的页面 加上NO FOLLOW 这样更有利于搜索引擎辨别。URLLIST.TXT 或者ROBOTS.TXT 如果方便好做一下,yahoo等搜索引擎比较认可,谷歌也有这个项目。

  另外在robots文本里要写好网站地图位置即格式。

  六、生成工具

  1、Xenu Link Sleuth

  可同时生成html格式地图(适用于小型站点)和XML格式地图。

  2、XML Sitemap

  在线生成工具,网站地址很多时,会比较浪费时间,想生成所有,则需要收费。

  3、Sitemap Generator

  强大的sitemap生成器,需下载安装客户端

  七、怎样创建

  1、在网站地图的文本和超级链接里提及主要的关键词短语,帮助搜索引擎来识别,所链接的页面主题是什么。

  2、为每一个链接提供一个简短的介绍,以提示访问者这部分内容是关于哪方面的。

  3、提供文本链接到你站点上主要的页面上;根据您的网站大小,网页数目的多少,它甚至可以链接到您所有的页面。

  4、为搜索引擎提供一条绿色通道,使搜索引擎程序把您的主要网页迅速收录进去。

  5、当用户查寻在您网站上原来看过的相关信息时,告诉他们如何去查询。只要在这一个网页内就可以得到所有希望查找的内容链接。

  6、帮助搜索引擎轻松索引一些动态页面。由于一些页面将是动态产生,如果不是用户行为调用,将不会显示出来,您可以将此链接放在您的网站地图上,以帮助搜索引擎来索引您重要的动态页面。

  7、建立网站地图后,当访问者访问网站时,可以轻松找到他们所需要的内容;当搜索引擎蜘蛛爬行网站时,可以快速访问整个站点。为了使网站地图吸引网络蜘蛛与访问者,一定要在链接后写上一定的描述性的短句和与此链接相关的关键词,切记不要使用过多的关健词。当访问者感觉到地图好用时,搜索引擎也同样能正确地理解地图的意义。不管网站的大小,页面的多少,给网站添加一个网站地图,是非常必要的。

  针对与百度的网站地图(sitemap)

  Sitemap(即站点地图)就是您网站上各网页的列表。创建并提交Sitemap有助于百度发现并了解您网站上的所有网页。您还可以使用Sitemap提供有关您网站的其他信息,如上次更新日期、Sitemap文件的更新频率等,供百度Spider参考。

  百度对已提交的数据,不一定会抓取及索引所有网址。但是,我们会使用Sitemap中的数据来了解网站的结构等信息,这样可以帮助我们改进抓取策略,并在日后能地对网站进行抓取。此外,Sitemap 与搜索排名没有关系。

  二、百度Sitemap协议都支持哪些格式?

  百度Sitemap协议支持三种格式:文本格式、xml格式、Sitemap索引格式,可以根据自己情况来选择任意一种格式组织sitemap。具体格式说明及示例如下:

  1.种格式样例:txt文本格式

  在一个txt文本列明需要向百度提交的链接地址,将txt文本文件通过站长平台进行提交

  http://www.example.com/repaste/101562698_5230191316.html

  http://www.example.com/repaste/101586283_5230215075.html

  http://www.example.com/repaste/101639435_5230310576.html

  此文本文件需要遵循以下指南:

  文本文件每行都必须有一个网址。网址中不能有换行。不应包含网址列表以外的任何信息。

  您必须书写完整的网址,包括 http。

  每个文本文件多可包含 50,000 个网址,并且应小于10MB(10,485,760字节)。如果网站所包含的网址超过 50,000 个,则可将列表分割成多个文本文件,然后分别添加每个文件。

  文本文件需使用 UTF-8 编码或GBK编码。

  2.第二种格式样例:xml格式

  单个xml数据格式如下:

  <?xml version="1.0" encoding="utf-8"?>

  <!-- XML文件需以utf-8编码-->

  <urlset>

  <!--必填标签-->

  <url>

  <!--必填标签,这是具体某一个链接的定义入口,每一条数据都要用<url>和</url>包含在里面,这是必须的 -->

  <loc>http://www.yoursite.com/yoursite.html</loc>

  <!--必填,URL链接地址,长度不得超过256字节-->

  <lastmod>2009-12-14</lastmod>

  <!--可以不提交该标签,用来指定该链接的后更新时间-->

  <changefreq>daily</changefreq>

  <!--可以不提交该标签,用这个标签告诉此链接可能会出现的更新频率 -->

  <priority>0.8</priority>

  <!--可以不提交该标签,用来指定此链接相对于其他链接的优先权比值,此值定于0.0-1.0之间-->

  </url>

  <url>

  <loc>http://www.yoursite.com/yoursite2.html</loc>

  <lastmod>2010-05-01</lastmod>

  <changefreq>daily</changefreq>

  <priority>0.8</priority>

  </url>

  </urlset>

  上述Sitemap向百度提交了一个url:http://www.yoursite.com/yoursite.html

  若有多条url,按照上述格式重复<url></url>之间的片断,列明所有url地址,打包到一个xml文件,向站长平台进行提交。

  3.第三种格式样例:Sitemap索引格式

  如需提交大量sitemap文件,则可将其列在sitemap索引文件中,然后将该索引文件提交。您无需分别提交每个文件。

  <?xml version="1.0" encoding="utf-8"?>

  <!-- XML文件需以utf-8编码-->

  <sitemapindex>

  <!--必填,以 <sitemapindex> 开始标记作为开始,以 </sitemapindex> 结束标记作为结束-->

  <sitemap>

  <!--必填,以<sitemap>标签提交一个子sitemap文件-->

  <loc>http://example.com/ext/xmlsitemap/add/201201/index_20120106.xml</loc>

  <!--必填,识别sitemap的位置-->

  <lastmod>2009-12-14</lastmod>

  <!--选填,识别相对sitemap文件的修改时间-->

  </sitemap>

  <!--必填,标签闭合-->

  </sitemapindex>

  <!--必填,标签闭合-->

  有多个Sitemap,按上述格式重复<sitemap></sitemap>之间的片断,列明所有Sitemap地址,向站长平台进行提交。

  三、什么是移动Sitemap协议,如何提交Sitemap到移动搜索?

  百度推出了移动Sitemap协议,用于将网址提交给移动搜索收录。百度移动Sitemap协议是在标准Sitemap协议基础上制定的,增加了<mobile:mobile/>标签,它有三种取值:

  <mobile:mobile/> :移动网页

  <mobile:mobile type="mobile"/> :移动网页

  <mobile:mobile type="autoadapt"/>:自适配网页,适用于同一网址页面,会随设备不同改变展现的情况。

  无该标签表示PC的网页

  下方样例相当于向百度移动搜索提交了一个移动网页:http://m.example.com/index.html,向PC搜索提交了一个传统网页:http://www.example.com/index.html,同时向移动搜索和PC搜索提交了一个自适配网页http://www.example.com/autoadapt.html:

  <?xml version="1.0" encoding="UTF-8" ?>

  <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"

  xmlns:mobile="http://www.baidu.com/schemas/sitemap-mobile/1/">

  <url>

  <loc>http://m.example.com/index.html</loc>

  <mobile:mobile type="mobile"/>

  <lastmod>2009-12-14</lastmod>

  <changefreq>daily</changefreq>

  <priority>0.8</priority>

  </url>

  <url>

  <loc>http://www.example.com/index.html</loc>

  <lastmod>2009-12-14</lastmod>

  <changefreq>daily</changefreq>

  <priority>0.8</priority>

  </url>

  <url>

  <loc>http://www.example.com/autoadapt.html</loc>

  <mobile:mobile type="autoadapt"/>

  <lastmod>2009-12-14</lastmod>

  <changefreq>daily</changefreq>

  <priority>0.8</priority>

  </url>

  </urlset>

  提交Sitemap到移动搜索的方法,参考第四条,按照移动Sitemap协议做好Sitemap后,在Sitemap工具点击添加新数据提交,与提交普通Sitemap方式一致。

  四、创建sitemap时有哪些注意事项?如何提交sitemap?

  注意事项

  一个Sitemap文件包含的网址不得超过 5 万个,且文件大小不得超过 10 MB。如果您的Sitemap超过了这些限值,请将其拆分为几个小的Sitemap。这些限制条件有助于确保您的网络服务器不会因提供大文件而超载。

  一次性多提交50个地址,提交地址的文件类型和更新周期必须一致。

  如果验证了网站的主域,那么Sitemap文件中可包含该网站主域下的所有网址。

  如果验证的www.example.com,你只能提交该验证网站的网址,不能出现其他网站的网址。

  提交步骤

  将需提交的网页列表制作成一个Sitemap文件,文件格式请阅读百度Sitemap协议都支持哪些格式。

  将Sitemap文件放置在网站目录下。比如您的网站为example.com,您已制作了一个sitemap_example.xml的Sitemap文件,将sitemap_example.xml上传至网站根目录即example.com/sitemap_example.xml

  登录百度站长平台,确保提交Sitemap数据的网站已验证归属。

  进入Sitemap工具,点击“添加新数据”,文件类型选择“URL列表”,填写抓取周期和Sitemap文件地址

  提交完之后,可在Sitemap列表里看到提交的Sitemap文件,如果Sitemap文件里面有新的网站链接,可以选择文件后,点击更新所选,即对更新的网站链接进行了提交。

  五、我提交时填写的周期是什么含义?

  百度Spider会参考设置周期抓取Sitemap文件,因此请根据Sitemap文件内容的更新(比如增加新url)来设置。请注意若url不变而仅是url对应的页面内容更新(比如论坛帖子页有新回复内容),不在此更新范围内。Sitemap工具不能解决页面更新问题。

  六、Sitemap提交后,多久能被百度处理?

  Sitemap数据提交后,一般在1小时内百度会开始处理。处理完成的时间视文件大小和您设置的抓取周期而定。

  七、提交的Sitemap都会被百度抓取并收录吗?

  百度对已提交的数据,不一定会抓取及收录所有网址。是否收录与页面质量相关。

  八、我可以压缩我的 Sitemap 吗?它们是否需要用 gzip 压缩?

  可以。请使用 gzip 压缩 Sitemap。无论压缩与否,Sitemap 应该小于 10MB(10,485,759字节)。

  九、XML格式的 Sitemap 中,“priority”提示会影响我的网页在搜索结果中的排名吗?

  不会。Sitemap 中的“priority”提示只是说明该网址相对于您自己网站上其他网址的重要性,并不会影响网页在搜索结果中的排名。

  十、网址在 Sitemap 中的位置是否会影响它的使用?

  不会。网址在 Sitemap 中的位置并不会影响百度对它的识别或使用方式。

  十一、Sitemap中提交的url能否包含中文?

  因为转码问题建议好不要包含中文。