« Movable Type 3.17发布 | 首页 | Movable Type的Sitemap模板及其他生成器 »

分类: 极风潮

2005年06月04日

Google Sitemaps (BETA)

  Google又出新花样,Sitemaps(站点地图)免费服务正在测试中。与以往不同的是,这次Google推出Sitemaps是打着Collaboration(协同工作)的旗帜。Sitemaps服务旨在使用Feed文件sitemap.xml通知Google的Crawler(爬虫)网站上哪些文件需要索引、这些文件的最后修订时间、更改频度、文件位置、相对优先索引权,这些信息将帮助Google Crawler建立索引范围和索引的行为习惯。原先传统的爬虫方式当然会继续工作下去,但是Google倡议站长们利用Sitemaps技术与搜索引擎形成积极互动的协作关系,真正参与到搜索引擎的索引页面缓存的建立中来,改变爬虫机械式的重复工作模式,使搜索引擎能返回更准确有效的的结果,同时也可以有效地减少带宽的消耗以及服务器的压力,提高互联网的效率......

sitemap文件必须包含几个主要的描述性标记:

  • changefreq — 文件更改频度,可以是always/hourly/daily/weekly/monthly/yearly/never中的任意一个值
  • lastmod — 文件最后被修订的时间,必须是遵循ISO 8601规范的时间戳格式,比如2005-06-04或2005-06-04T02:20:30+08:00
  • loc — 文件通用资源定位符地址,呵呵,就是URL网址,绝对地址
  • priority — 相对于同一站点上其他文件的被索引的优先权,值域0.0~1.0,默认值是0.5
  • url — 用来包围以上四个标记
  • urlset — 用来包围以上五个标记

例如:


<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
 <url>
  <loc>http://plod.popoever.com/</loc>
  <lastmod>2005-06-04</lastmod>
  <changefreq>daily</changefreq>
  <priority>0.8</priority>
 </url>
 <url>
  <loc>http://plod.popoever.com/archives/cat_google_around.html</loc>
  <changefreq>weekly</changefreq>
 </url>
 <url>
  <loc>http://plod.popoever.com/archives/2005_06.html</loc>
  <lastmod>2005-06-04</lastmod>
  <changefreq>monthly</changefreq>
 </url>
</urlset>

sitemap文件必须使用UTF-8编码,所有实体必须转换成字符,可以压缩成.gz格式以减小文件体积,节省带宽,但是文件未压缩体积不能大于10MB(10,485,760字节),否则的话必须使用多个sitemap文件,而这些sitemap文件必须在sitemap_index.xml中通过loc标记分别指定sitemap文件来得到索引,但sitemap_index.xml不能索引超过1000个sitemap文件。

例如:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.google.com/schemas/sitemap/0.84">
 <sitemap>
  <loc>http://www.mysite.com/sitemap1.xml.gz</loc>
  <lastmod>2004-10-01T18:23:17+00:00</lastmod>
 </sitemap>
 <sitemap>
  <loc>http://www.mysite.com/sitemap2.xml.gz</loc>
  <lastmod>2005-01-01</lastmod>
 </sitemap>
</sitemapindex>

  同时Google也准备了Sitemap Generator(地图生成器)这个开源项目的Python脚本方便站长们使用,脚本必须运行于Python 2.2以上环境,请访问安装使用介绍页面。更多内容也可以订阅Google Group上的Sitemaps论坛来获得。我刚才传了我的RSS上去试试它竟然也通过了,晕,难道没有校验程序么~~~

  Google总是比我们smarter一点,而现在我们又要帮助Google的爬虫更smarter一点,我们是不是很那个什么的啊?!而近期真正实惠的是Google已经开通中文的“更多”,并且“大学搜索”也已经本地化,可以查询中国的大学了。

Posted by POPOEVER at 2005年06月04日 03:14 | back to top
Featured

Trackback Pings

本篇日志的回溯引用地址:

http://plod.popoever.com/acp630/mt-tb.cgi/579

Listed below are links to weblogs that reference 'Google Sitemaps (BETA)' from Plod.


  1. #1264

    » Google Sitemaps (BETA) from En8's Blog
      [url=https://www.google.com/] Google[/url]又出新花样,[url=https://www.google.com/webmasters/sitemaps] Sitemaps(站点地图)[/url]免费服务正在测试中。与以往不同的是,这次Google推出Sitemaps是打着Collaboration(协同...

    Tracked on 2005年06月06日 09:07 from this weblog | back to top

  2. #1355

    » Google SiteMap 生成工具 (PHP & ASP) from *Siyizhu's Weblog | 简单的快乐
    参数说明: $website--你的域名 $page_root--你的站点的绝对路径 $changefreq--更新时间单位 "always"(始终), "hourly"(小时), "daily"(天), "weekly"(星期), "monthly"(月), "yearly" "never"(从不) $priority--更新频率 $allow_dir...

    Tracked on 2005年06月16日 14:00 from this weblog | back to top

  3. Tracked on 2005年09月14日 01:01 from this weblog | back to top

  4. #1468

    » 完美的Show from Gfans.org
      今天看到两则关于Google的新闻,一则是"Google推中文版站点地图",另一则是“Google推出李开复Blog”  Google Sitemaps的新闻其实一点也不新,中文化也是好几天前的事。至于如何应用,早就...

    Tracked on 2005年09月14日 01:02 from this weblog | back to top

  5. #1657

    » GOOGLE ADSENSE TIP from GOOGLE ADSENSE TIP
    GOOGLE ADSENSE TIP

    Tracked on 2005年10月22日 18:05 from this weblog | back to top

  6. #2005

    » links for 2006-01-27 from XXC@Blog
    Plod: Google Sitemaps (BETA) Google Sitemap 介紹 (tags: Googel_Sitemaps) Google Sitemaps Google Sitemaps: 協助網站管理者分析網站內容的工具 (tags: Google_Sitemaps WebToolService WebDesignTool Statistics) Plod: Movable Type的Sitemap

    Tracked on 2006年01月27日 23:13 from this weblog | back to top

Comments


  1. #2469

    我去google下载了一个范例,然后又下载了一个Python。不知道怎么使用~汗

    Posted by 婴尘 at 2005年06月04日 12:29 | back to top

  2. #2470

    试试去

    Posted by yujie at 2005年06月04日 13:37 | back to top

  3. #2520

    去试试看那

    Posted by 成都锐杰工作室 at 2005年06月13日 00:25 | back to top

  4. #2555

    介绍的很详细,谢谢了!

    Posted by windlike at 2005年06月17日 15:35 | back to top

  5. #2570

    如果要屏蔽某个目录的话,priority=0就可以了吧?

    Posted by 爱狗 at 2005年06月20日 12:12 | back to top

  6. #2571

    To: 爱狗,priority 是索引优先权,只是告诉爬虫索引的优先次序

    Posted by POPOEVER at 2005年06月20日 13:23 | back to top

  7. #2614

    to:POPOEVER
    我现在是直接添加RSS的url。
    试了重庆森林整理的那个,结果检验失败。

    Posted by 爱狗 at 2005年06月24日 09:35 | back to top

  8. #7721

    我提交了一个上去,过了一个星期在google还是不能搜索自己的站点呢。奇怪

    Posted by Bobo at 2006年07月14日 01:03 | back to top

  9. #8662

    我的网站递交了很久了,GOOGLE根本就不理睬我,郁闷ING

    Posted by jimmy at 2006年10月25日 15:11 | back to top

  10. #8669

    都有没有按规范制作脚本呢?
    顺便测试夏令时结束了没有-_||

    Posted by POPOEVER at 2006年10月26日 10:34 | back to top

Post a comment

说老实话,做开心人,欢迎您留露箴言
即便如此,也请遵纪守法,勿放厥辞
汝国如汝母,辱国如辱母,吾辈当自强
您的观点仅代表个人,与本站无关,望请自尊

Thanks for signing in, . Now you can comment. (sign out)

(If you haven't left a comment here before, you may need to be approved by the site owner before your comment will appear. Until then, it won't appear on the entry. Thanks for waiting.)


Remember me?