首先在百度新闻的更多新闻服务页面,发现“互联网新闻开放协议”。哇! 原来还有这么个新闻协议啊!进入新闻协议页面,认真阅读每一个字,明白了一个事实——“百度抓新闻的蜘蛛是按照新闻协议的XML文件抓取,而不是我原先想像的普通抓取后判断成为新闻。这样成为新闻源还是有希望的。”
1. 只要你在自己的站点增加新闻协议XML文件,通过百度人工验证后,就能成为百度新闻源。让百度蜘蛛定时来“打工”。
2. 开发协议是一个XML格式文件,语法也非常简单。详见:http://news.baidu.com/newsop.html#kn2
明白这2点后,我就开始按照语法写了一个XML文件:http://www.seotest.cn/news.xml
这里给大家一个可以套用的格式,大家把下面【……】替换成你自己的内容就可以:
<?xml version="1.0" encoding="gb2312" ?>
- <document>
<webSite>【网站域名】</webSite>
<webMaster>【管理员EMAIL】</webMaster>
<updatePeri>【更新时间】</updatePeri>
- <item>
<title>【新闻标题】</title>
<link>【新闻页面url】</link>
<description>【这里放新闻简介,别太长】</description>
<text>【这里是新闻具体内容,使用WORD把换行去掉】</text>
<image />
<headlineImg />
<keywords>【关键词】</keywords>
<category>【新闻分类】</category>
<author>【作者】</author>
<source>【来源】</source>
<pubDate>【新闻日期】</pubDate>
</item>
</document>
我已经向百度提交了自己的xml文件,状态是待审核中。但估摸着不会通过人工审核,我写的文章还是太口语化了,并且百度明说不收录博客作为新闻源。当然,这样一次学习过程,还是非常有价值,以后一定能用上。
SEO学习,无边无际啊,继续加油!
