« Movable Type 3.17发布 | 首页 | Movable Type的Sitemap模板及其他生成器 »
分类: 极风潮
2005年06月04日
Google Sitemaps (BETA)
Google又出新花样,Sitemaps(站点地图)免费服务正在测试中。与以往不同的是,这次Google推出Sitemaps是打着Collaboration(协同工作)的旗帜。Sitemaps服务旨在使用Feed文件sitemap.xml通知Google的Crawler(爬虫)网站上哪些文件需要索引、这些文件的最后修订时间、更改频度、文件位置、相对优先索引权,这些信息将帮助Google Crawler建立索引范围和索引的行为习惯。原先传统的爬虫方式当然会继续工作下去,但是Google倡议站长们利用Sitemaps技术与搜索引擎形成积极互动的协作关系,真正参与到搜索引擎的索引页面缓存的建立中来,改变爬虫机械式的重复工作模式,使搜索引擎能返回更准确有效的的结果,同时也可以有效地减少带宽的消耗以及服务器的压力,提高互联网的效率......
sitemap文件必须包含几个主要的描述性标记:
- changefreq — 文件更改频度,可以是always/hourly/daily/weekly/monthly/yearly/never中的任意一个值
- lastmod — 文件最后被修订的时间,必须是遵循ISO 8601规范的时间戳格式,比如2005-06-04或2005-06-04T02:20:30+08:00
- loc — 文件通用资源定位符地址,呵呵,就是URL网址,绝对地址
- priority — 相对于同一站点上其他文件的被索引的优先权,值域0.0~1.0,默认值是0.5
- url — 用来包围以上四个标记
- urlset — 用来包围以上五个标记
例如:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<url>
<loc>http://plod.popoever.com/</loc>
<lastmod>2005-06-04</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://plod.popoever.com/archives/cat_google_around.html</loc>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://plod.popoever.com/archives/2005_06.html</loc>
<lastmod>2005-06-04</lastmod>
<changefreq>monthly</changefreq>
</url>
</urlset>
sitemap文件必须使用UTF-8编码,所有实体必须转换成字符,可以压缩成.gz格式以减小文件体积,节省带宽,但是文件未压缩体积不能大于10MB(10,485,760字节),否则的话必须使用多个sitemap文件,而这些sitemap文件必须在sitemap_index.xml中通过loc标记分别指定sitemap文件来得到索引,但sitemap_index.xml不能索引超过1000个sitemap文件。
例如:
<sitemapindex xmlns="http://www.google.com/schemas/sitemap/0.84">
<sitemap>
<loc>http://www.mysite.com/sitemap1.xml.gz</loc>
<lastmod>2004-10-01T18:23:17+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.mysite.com/sitemap2.xml.gz</loc>
<lastmod>2005-01-01</lastmod>
</sitemap>
</sitemapindex>
同时Google也准备了Sitemap Generator(地图生成器)这个开源项目的Python脚本方便站长们使用,脚本必须运行于Python 2.2以上环境,请访问安装使用介绍页面。更多内容也可以订阅Google Group上的Sitemaps论坛来获得。我刚才传了我的RSS上去试试它竟然也通过了,晕,难道没有校验程序么~~~
Google总是比我们smarter一点,而现在我们又要帮助Google的爬虫更smarter一点,我们是不是很那个什么的啊?!而近期真正实惠的是Google已经开通中文的“更多”,并且“大学搜索”也已经本地化,可以查询中国的大学了。
Trackback Pings
本篇日志的回溯引用地址:
http://plod.popoever.com/acp630/mt-tb.cgi/579
Listed below are links to weblogs that reference 'Google Sitemaps (BETA)' from Plod.
#1264
» Google Sitemaps (BETA) from En8's Blog
[url=https://www.google.com/] Google[/url]又出新花样,[url=https://www.google.com/webmasters/sitemaps] Sitemaps(站点地图)[/url]免费服务正在测试中。与以往不同的是,这次Google推出Sitemaps是打着Collaboration(协同...Tracked on 2005年06月06日 09:07 from this weblog | back to top
#1355
» Google SiteMap 生成工具 (PHP & ASP) from *Siyizhu's Weblog | 简单的快乐
参数说明: $website--你的域名 $page_root--你的站点的绝对路径 $changefreq--更新时间单位 "always"(始终), "hourly"(小时), "daily"(天), "weekly"(星期), "monthly"(月), "yearly" "never"(从不) $priority--更新频率 $allow_dir...Tracked on 2005年06月16日 14:00 from this weblog | back to top
#1467
» 完美的Show from Dash's Blog
今天看到两则关于Google的新闻,一则是"Google推中文版站点地图",另一则...Tracked on 2005年09月14日 01:01 from this weblog | back to top
#1468
» 完美的Show from Gfans.org
今天看到两则关于Google的新闻,一则是"Google推中文版站点地图",另一则是“Google推出李开复Blog” Google Sitemaps的新闻其实一点也不新,中文化也是好几天前的事。至于如何应用,早就...Tracked on 2005年09月14日 01:02 from this weblog | back to top
#1657
» GOOGLE ADSENSE TIP from GOOGLE ADSENSE TIP
GOOGLE ADSENSE TIPTracked on 2005年10月22日 18:05 from this weblog | back to top
#2005
» links for 2006-01-27 from XXC@Blog
Plod: Google Sitemaps (BETA) Google Sitemap 介紹 (tags: Googel_Sitemaps) Google Sitemaps Google Sitemaps: 協助網站管理者分析網站內容的工具 (tags: Google_Sitemaps WebToolService WebDesignTool Statistics) Plod: Movable Type的SitemapTracked on 2006年01月27日 23:13 from this weblog | back to top
Comments
#2469
我去google下载了一个范例,然后又下载了一个Python。不知道怎么使用~汗
Posted by 婴尘 at 2005年06月04日 12:29 | back to top
#2470
试试去
Posted by yujie at 2005年06月04日 13:37 | back to top
#2520
去试试看那
Posted by 成都锐杰工作室 at 2005年06月13日 00:25 | back to top
#2555
介绍的很详细,谢谢了!
Posted by windlike at 2005年06月17日 15:35 | back to top
#2570
如果要屏蔽某个目录的话,priority=0就可以了吧?
Posted by 爱狗 at 2005年06月20日 12:12 | back to top
#2571
To: 爱狗,priority 是索引优先权,只是告诉爬虫索引的优先次序
Posted by POPOEVER at 2005年06月20日 13:23 | back to top
#2614
to:POPOEVER
我现在是直接添加RSS的url。
试了重庆森林整理的那个,结果检验失败。
Posted by 爱狗 at 2005年06月24日 09:35 | back to top
#7721
我提交了一个上去,过了一个星期在google还是不能搜索自己的站点呢。奇怪
Posted by Bobo at 2006年07月14日 01:03 | back to top
#8662
我的网站递交了很久了,GOOGLE根本就不理睬我,郁闷ING
Posted by jimmy at 2006年10月25日 15:11 | back to top
#8669
都有没有按规范制作脚本呢?
顺便测试夏令时结束了没有-_||Posted by POPOEVER at 2006年10月26日 10:34 | back to top
Post a comment
即便如此,也请遵纪守法,勿放厥辞
汝国如汝母,辱国如辱母,吾辈当自强
您的观点仅代表个人,与本站无关,望请自尊
Thanks for signing in, . Now you can comment. (sign out)
(If you haven't left a comment here before, you may need to be approved by the site owner before your comment will appear. Until then, it won't appear on the entry. Thanks for waiting.)