SEO-搜索引擎优化实验室

上海SEO顾问(中国最具原创精神的SEO博客)

« 中秋祝福:Kyw祝福大家中秋快乐,合家团圆 ^_^SEO优化案例:小说网站的SEO优化 »

搜索引擎抓取JS代码实验

JavaScript在页面中有2种常见方式,一种是JS做成外部文件,页面直接调用,下面是上海SEO实验室的一行代码:

<script language="JavaScript" src="http://www.seotest.cn/script/common.js" type="text/javascript"></script>


另一种是在页面直接写上JS代码,例如:

<script language="JavaScript">
try{
        var elScript = document.createElement("script");
        elScript.setAttribute("language", "JavaScript");
        elScript.setAttribute("src", "http://www.seotest.cn/function/c_html_js.asp?act=batch"+"&view=" + escape(strBatchView)+"&inculde=" + escape(strBatchInculde)+"&count=" + escape(strBatchCount));
        document.getElementsByTagName("body")[0].appendChild(elScript);
        }
catch(e){};
</script>


从搜索引擎抓取角度来说,第一种不包含任何文字信息,所以搜索引擎无法从中提取内容。但第二种如果出现文字内容,搜索引擎是否能抓取其中的内容呢?

实验思路:
制作一个只有JS代码的页面,JS代码内包含中文内容。然后等待搜索引擎收录后,在SERP和网页快照内查看结果。

实验页面:
(http://www.seotest.cn/testpage/tp009.html)

实验页面全部代码如下:

<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
<title>2007-9-25 中秋节开始的实验</title>
</head>

<body>
<SCRIPT type="text/javascript">
document.writeln("JS抓取实验:<br>");
document.writeln("试试放在JS代码里的文字,是否会被搜索引擎抓取到呢?");
</SCRIPT>
</body>
</html>


如果您希望尽快查看到实验结果,请转载本文或给实验页面增加外部链接,这样可以帮助搜索引擎尽快收录该页面,我们也就能更快获得结果。

SE抓取JS代码实验结果: http://www.seotest.cn/blog/se-javascript-jieguo.html

 作者:Kyw@上海SEO搜索引擎优化实验室
 原文链接:http://www.seotest.cn/blog/javascript-shoulu-shiyan.html
 版权所有,转载请以链接形式注明作者及原始出处。

好文章就要收藏:


  • quote 2.呵呵
  • 楼主很有意思
    Kyw 于 2007-9-25 21:26:25 回复
    ? 有意思?
  • 2007-9-25 21:26:25 回复该留言
  • quote 3.狂风
  • 有意思,很想知道结果
    Kyw 于 2007-9-26 8:49:16 回复
    那就帮忙转载加外链咯 ^_^
  • 2007-9-26 8:49:16 回复该留言
  • quote 7.点石成金
  • http://www.ywfzl.cn
  • google已经收录了此页
    http://www.google.cn/search?q=2007-9-25%20%D6%D0%C7%EF%BD%DA%BF%AA%CA%BC%B5%C4%CA%B5%D1%E9&amp;amp;hl=zh-CN&amp;amp;inlang=zh-CN&amp;amp;ie=GB
    能够抓取JS中的文字
    Kyw 于 2007-10-4 9:53:16 回复
    GOOGLE并没有抓取JS里的文件,或者是抓取了不显示。
    Box 于 2008-4-3 16:41:28 回复
    实验结果怎么样啊?
    有没有抓取到?

    google已经收录了此页
    http://www.google.cn/search?q=2007-9-25%20%D6%D0%C7%EF%BD%DA%BF%AA%CA%BC%B5%C4%CA%B5%D1%E9&amp;hl=zh-CN&amp;inlang=zh-CN&amp;ie=GB
    能够抓取JS中的文字

    这个应该不能算个抓取到!
  • 2008-4-3 16:41:28 回复该留言
  • quote 8.swsw007目标关键词jay
  • http://www.jielun.org
  • google可以,在soso的快照里看到了内容了。
    有一个问题:如果js里没有内容就一定抓不着么???
    Kyw 于 2007-10-4 9:53:55 回复
    SOSO 和 GG 还是有小小区别的。
  • 2007-10-4 9:53:55 回复该留言
  • quote 10.jrek
  • http://seoworth.cn/
  • 等着baidu
    晕,不知道为什么我这里看不到soso快照。
    我也在做个试验:http://seoworth.cn/seo-test.html 期待结果。
    Kyw 于 2007-10-11 9:09:35 回复
    能说明一下你的实验吗?
  • 2007-10-11 9:09:35 回复该留言
  • quote 11.leerbaby
  • http://bbs.leerbaby.com
  • 我觉得SE应该不会抓取JS的内容,毕竟编程语言不是那么容易理解,稍有偏差相差十万八千里,是不是还需要一个编译器呢,有那么多时间去处理这些数据吗,我个人觉得不太可能。
    Kyw 于 2007-10-11 9:11:06 回复
    我觉得GOOGLE有能力理解JS,但可能理解了JS没太大意义又消耗很多资源,所以是有能力但不分析而已。
  • 2007-10-11 9:11:06 回复该留言
  • quote 12.我已经知道结果了
  • 我告诉大家答案好了

    GG是会抓取像你这个实验页面这样这么简单的JS代码里面的文字的,所以你的那个是会被GG抓取的,但是不会被BAIDU抓,BAIDU应该还没有这个能力抓这些东东
    Kyw 于 2007-10-11 9:13:29 回复
    我的实验页面被GOOGLE收录了,但在搜索结果里没有显示出那些文字。
    我已经知道结果了 于 2007-10-11 16:42:57 回复
    我真的很佩服KYW的精神,几乎每个回帖KYW都会回复,这点真难得~~~

    我可以很明确的说,GG完全可以抓取这个东西,我在上半年就做过类似的页面,虽然不是为了做这个实验,但是也等于一次实验了~~~
    难不成我还会骗你撒~~?

    KYW~~想和你交个朋友了,说实话我难得去一次点石,但是会经常来SEO实验室
    我已经知道结果了 于 2007-10-11 16:44:13 回复
    主要是你的实验页面的JS代码很简单,所以是可以抓取的~~~~
    我已经知道结果了 于 2007-10-11 16:45:27 回复
    并不是因为简单才抓取哈~~~只是简单更利于抓取
    复杂的抓取就比较困难,很少抓取
    Kyw 于 2007-11-23 22:29:25 回复
    有抓取的例子吗?
  • 2007-11-23 22:29:25 回复该留言
  • quote 15.午夜客
  • http://www.wyk.net.ru
  • 结果出来了吗?
    Kyw 于 2007-11-27 22:55:29 回复
    SE抓取JS代码实验结果: http://www.seotest.cn/blog/se-javascript-jieguo.html
  • 2007-11-27 22:55:29 回复该留言
  • quote 16.我已经知道结果了
  • http://www.baidu.com/s?ie=gb2312&bs=%D1%B8%C0%D7%D4%B4%C2%EB&sr=&z=&cl=3&f=8&wd=%D0%C2%CC%EC%CC%C3%B5%A5%D3%C3%BB%A7%CF%E0%B2%E1%D6%AE%B0%CD%B0%CD%B1%E4&ct=0

    帅哥,这个搜索页面,第十个搜索结果,就是锋林的站。

    http://www.5ixb.com/data/js/new4.js
    ·新天堂单用户相册之巴巴变 ·易影中国电影程序CGI版 ·SnowNews(网站综合管理系统) ·Advanced Web Statistics(AW ·雷傲极酷超级论坛LeoBBS X 0 ·点出统计 v1.0 ·Freelove 交友程序 ·易影中国电影程序CGI版 ·雷傲极酷超级...
    www.5ixb.com/data/js/new4.js 1K 2007-10-8 - 百度快照
    www.5ixb.com 上的更多结果
  • 2007-12-4 20:39:54 回复该留言
  • quote 17.我已经知道结果了
  • document.write(&quot;&lt;table border=\&quot;0\&quot; cellspacing=0 cellpadding=0&gt;&lt;tr height=20&gt;&lt;td&gt;·&lt;a href=http://www.5ixb.com/data/soft/58.html title=\'新天堂单用户相册之巴巴变\' target=_blank&gt;新天堂单用户相册。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
    Kyw 于 2007-12-4 20:56:00 回复
    谢谢,不错的发现。 另外,GOOGLE你看实验页面的快照,其实也收录JS了。
  • 2007-12-4 20:56:00 回复该留言
  • quote 21.rentj1
  • 我也看到GOOGLE快照的结果了,确实可以抓到JS里的文字信息.
    只是点击"只查看缓存文本"时就看不到文本内容了
    Kyw 于 2008-3-15 9:51:07 回复
    在快照里的JS,应该是JS运行后的结果,在GG数据库里应该只是一段文字。
  • 2008-3-15 9:51:07 回复该留言
  • quote 24.QQ625251211
  • <SCRIPT type="text/javascript">
    document.writeln("JS抓取实验:<br>");
    document.writeln("试试放在JS代码里的文字,是否会被搜索引擎抓取到呢?");
    </SCRIPT>
    这类JS写法,百度蜘蛛完全可以抓取到,只要该网站权重高,这类的JS包含的文字会在快照里显示出来(本人亲自测试过)^_^.
    Kyw 于 2008-11-17 23:15:56 回复
    搜索引擎对简单的JS都可以处理。
  • 2008-11-17 17:00:46 回复该留言

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

Auto Publisher ©2007-2009 上海SEO|搜索引擎优化实验室 版权所有  沪ICP备07005018号

Powered By Z-Blog