当前位置:首页 > 运营推广

抓了10w个头条数据,分析了1w条爆文,写出了10w阅读的内容

时间:2019-01-26 16:41:02来源:运营推广作者:seo实验室小编阅读:61次「手机版」
 

内容

理论

今日头条在2012年创立之后,一路高歌猛进,积累了大量的用户,曾一度号称日均活跃用户高达2.5亿,可见其用户体量是何等的巨大,这也成了作为我们重要的引流阵地。期间,也有很多前辈写了一些关于今日头条技术攻略文章,总体可以归纳为以下几个量化的指标

1) 点击

2) 阅读时间

3) 评论

4) 点赞

5) 收藏

6) 转发

虽然这些因素都很重要,但是这些都不是我要讨论的点,我要讨论的重点是内容的构造。有些大佬也分享过,内容归结起来有两点:一是追热点,二是寻找热搜关键词,然后根据关键词去做内容。热点或热搜关键词可以通过以下几种渠道去寻找:

1) 新浪热搜(http://s.weibo.com/top/summary?cate=realtimehot)

2) 百度搜索风云榜(http://top.baidu.com/)

3) 关键词规划(http://www2.baidu.com/)

4) 5118(http://www.5118.com/)

5) 词库网(http://www.ciku5.com/)

6) 爱站词库(https://ci.aizhan.com/)

的确,这些都是行之有效的方法,但是我还想是从使用场景出发,来探讨一下内容构造。

场景举例

小纯是一个喜欢体育资讯的人,打开今日头条的时候,他会看一些体育资讯,当然看到热点新闻或者美女图片的时候,他也会点开了看一下,那么今日头条也会根据小纯的兴趣爱好和浏览轨迹,生成数据标签,可能给他贴上的标签是:90后、喜欢美女、猥琐男、体育,然后根据这些标签去给我推荐内容。

这个就是一般用户的使用场景,通过场景能够推导出内容首先需要满足两个条件:一是符合用户标签,二是标题具有吸引力的,根据标题跟标签去创造内容。那么什么样的内容才会具有两个条件?其实可以参看阅读量在10w+,100w+的爆文。

实操

工具

Python

python geckodriver

python phantomjs

python第三方库:selenium、jieba(结巴)

抓了10w个头条数据,分析了1w条爆文,写出了10w阅读的内容 自媒体 思考 SEO优化 经验心得 第1张

第一步,打开今日头条娱乐版块(https://www.toutiao.com/ch/news_entertainment/):

抓了10w个头条数据,分析了1w条爆文,写出了10w阅读的内容 自媒体 思考 SEO优化 经验心得 第2张

由于是信息流样式,所以只有不断的鼠标往下拉,才能得到之前的文章,那么我们小调用火狐浏览器,具体代码参考如下,它可以实现浏览器自动滑动,显示信息流的内容

抓了10w个头条数据,分析了1w条爆文,写出了10w阅读的内容 自媒体 思考 SEO优化 经验心得 第3张

然后excel整理得出的结果是,可以得出文章的url跟标题。

抓了10w个头条数据,分析了1w条爆文,写出了10w阅读的内容 自媒体 思考 SEO优化 经验心得 第4张

第二步,筛选高评论的文章,一般情况下,评论数跟阅读量是成正比的,然后抓取高评论文章的标签,代码参考如下:

抓了10w个头条数据,分析了1w条爆文,写出了10w阅读的内容 自媒体 思考 SEO优化 经验心得 第5张

然后excel整理得出的结果是,可以得出文章对应的标签。

抓了10w个头条数据,分析了1w条爆文,写出了10w阅读的内容 自媒体 思考 SEO优化 经验心得 第6张

最后通过excel数据透视表得出结果:

抓了10w个头条数据,分析了1w条爆文,写出了10w阅读的内容 自媒体 思考 SEO优化 经验心得 第7张

第三步,进行爆文标题分词,分析爆文出爆文常用词,代码参考如下:

抓了10w个头条数据,分析了1w条爆文,写出了10w阅读的内容 自媒体 思考 SEO优化 经验心得 第8张

经过Excel数据透视表整理得出结果,分析占比最大的常用词,

抓了10w个头条数据,分析了1w条爆文,写出了10w阅读的内容 自媒体 思考 SEO优化 经验心得 第9张

总结

1、 越多爆文都使用的标签,说明其受众是巨大的,才有可能成为爆文的可能;我们创作内容使用这些标签,或者针对这些标签创作内容,在一定程度上让我们内容具备了爆文的特质。

2、 除了内容本身之外,标题占了很重要的一部分,那么抓取标题常用词,在一定程度上就能够吸引到用户去点击我们所创作的内容。

作者:肖小纯(微信/QQ:593545575)

相关阅读

如何正确分析对手的网站

从小型的企业站到大型的门户站,以及商城网站等一系列企业网站都离不开分析,分析最关键的就是分析竞争对手的网站,孙子兵法中有一句老

https的优缺点分析

于这个问题,站长首先想到应该是网站安全问题,可以说网站安全问题其实是个大问题,主要表现在以下方面:1、首页会被篡改,非法跳转;2、网

网站需求的分析和解决方法

  一个网站是为了获得商业价值,而获得价值就需要目标用户访问,想要让目标用户访问网站,做好网站用户需求分析势在必行。一个没有

如何对网站访问者进行分析

如何对网站访问者进行分析?无论是商业性网站还是非商业性网站,只要是面对公众的网站,都有一个目标用户群体。在进行网站规划设计之前

Keil N01:的软件逻辑分析仪( logic analyzer)使用

在keil MDK中软件逻辑分析仪很强的功能,可以分析数字信号,模拟化的信号,CPU的总线(UART、IIC等一切有输出的管脚),提供调试函数机制,用

分享到:

栏目导航

推荐阅读

热门阅读