在 http://www.bchealth.cn/ 页脚,看到有一个Google Sitemap的链接,照理说应该是链接到标准的XML文件,但这个网站链接到了 http://www.bchealth.cn/googlesitemap.aspx ,其内容符合Google Sitemap文件标准。
这样的非XML文件,蜘蛛爬上后能否识别其中的链接,并且收录链接呢? 对于这个问题,进行一下实验:
·实验模型思路:
- 首先我在 testPage目录下建立一个页面:tp001.html
- 然后手动编写一个 sitemap.asp 文件,内容符合Google Sitemap标准。
- 在页面上加入 sitemap.asp 的链接,链接文字用“Google Sitemap”,见本站页面底部。
- 确保没有任何外部链接,直接链接到测试页面。
·实验面对搜索引擎:Google
·实验目标页面:http://www.seotest.cn/testPage/tp001.html
·实验想得到的结果: Google蜘蛛是否会自动辨认非XML扩展名的Sitemap文件。
2007年5月11日:
测试已经很长时间了,我的tp001.html一直没被收录,这次实验到此结束。 但有朋友说Google能认识非xml格式的SITEMAP。

