卢松松博客
返回首页返回首页
站长新闻站长新闻
好文分享好文分享
段子来了段子来了
科技资讯科技资讯
博客大全博客大全
松松视频在线视频
投稿中心投稿中心
松松营销人脉圈登陆/注册
松松商城万站群松松软文松松云
抓了10w个头条数据,分析了1w条爆文,写出了10w阅读的内容
7258 人参与 | 时间:2018年08月02日 07:18
理论
今日头条在2012年创立之后,一路高歌猛进,积累了大量的用户,曾一度号称日均活跃用户高达2.5亿,可见其用户体量是何等的巨大,这也成了作为我们重要的引流阵地。期间,也有很多前辈写了一些关于今日头条技术攻略文章,总体可以归纳为以下几个量化的指标:
1) 点击率
2) 阅读时间
3) 评论
4) 点赞
5) 收藏
6) 转发
虽然这些因素都很重要,但是这些都不是我要讨论的点,我要讨论的重点是内容的构造。有些大佬也分享过,内容归结起来有两点:一是追热点,二是寻找热搜关键词,然后根据关键词去做内容。热点或热搜关键词可以通过以下几种渠道去寻找:
1) 新浪热搜(http://s.weibo.com/top/summary?cate=realtimehot)
2) 百度搜索风云榜(http://top.baidu.com/)
3) 关键词规划师(http://www2.baidu.com/)
4) 5118(http://www.5118.com/)
5) 词库网(http://www.ciku5.com/)
6) 爱站词库(https://ci.aizhan.com/)
的确,这些都是行之有效的方法,但是我还想是从使用场景出发,来探讨一下内容构造。
场景举例
小纯是一个喜欢体育资讯的人,打开今日头条的时候,他会看一些体育资讯,当然看到热点新闻或者美女图片的时候,他也会点开了看一下,那么今日头条也会根据小纯的兴趣爱好和浏览轨迹,生成大数据标签,可能给他贴上的标签是:90后、喜欢美女、猥琐男、体育,然后根据这些标签去给我推荐内容。
这个就是一般用户的使用场景,通过场景能够推导出内容首先需要满足两个条件:一是符合用户标签,二是标题具有吸引力的,根据标题跟标签去创造内容。那么什么样的内容才会具有两个条件?其实可以参看阅读量在10w+,100w+的爆文。
实操
工具
python
python geckodriver
python PhantomJS
python第三方库:selenium、jieba(结巴)
抓了10w个头条数据,分析了1w条爆文,写出了10w阅读的内容 自媒体 思考 SEO优化 经验心得 第1张
第一步,打开今日头条娱乐版块(https://www.toutiao.com/ch/news_entertainment/):
抓了10w个头条数据,分析了1w条爆文,写出了10w阅读的内容 自媒体 思考 SEO优化 经验心得 第2张
由于是信息流样式,所以只有不断的鼠标往下拉,才能得到之前的文章,那么我们小调用火狐浏览器,具体代码参考如下,它可以实现浏览器自动滑动,显示信息流的内容
抓了10w个头条数据,分析了1w条爆文,写出了10w阅读的内容 自媒体 思考 SEO优化 经验心得 第3张
然后excel整理得出的结果是,可以得出文章的url跟标题。
抓了10w个头条数据,分析了1w条爆文,写出了10w阅读的内容 自媒体 思考 SEO优化 经验心得 第4张
第二步,筛选高评论的文章,一般情况下,评论数跟阅读量是成正比的,然后抓取高评论文章的标签,代码参考如下:
抓了10w个头条数据,分析了1w条爆文,写出了10w阅读的内容 自媒体 思考 SEO优化 经验心得 第5张
然后excel整理得出的结果是,可以得出文章对应的标签。
抓了10w个头条数据,分析了1w条爆文,写出了10w阅读的内容 自媒体 思考 SEO优化 经验心得 第6张
最后通过excel数据透视表得出结果:
抓了10w个头条数据,分析了1w条爆文,写出了10w阅读的内容 自媒体 思考 SEO优化 经验心得 第7张
第三步,进行爆文标题分词,分析爆文出爆文常用词,代码参考如下:
抓了10w个头条数据,分析了1w条爆文,写出了10w阅读的内容 自媒体 思考 SEO优化 经验心得 第8张
经过Excel数据透视表整理得出结果,分析占比最大的常用词,
抓了10w个头条数据,分析了1w条爆文,写出了10w阅读的内容 自媒体 思考 SEO优化 经验心得 第9张
总结
1、 越多爆文都使用的标签,说明其受众是巨大的,才有可能成为爆文的可能;我们创作内容使用这些标签,或者针对这些标签创作内容,在一定程度上让我们内容具备了爆文的特质。
2、 除了内容本身之外,标题占了很重要的一部分,那么抓取标题常用词,在一定程度上就能够吸引到用户去点击我们所创作的内容。
作者:肖小纯(微信/QQ:593545575)
相关阅读:
今日头条推荐算法原理全文详解
今日头条运营秘诀分享:让你的文章阅读量和收入都“飞”起来
2000万自媒体人必读:内容分发新逻辑全揭秘
顶: 4踩: 0
来源:卢松松博客,欢迎分享,(QQ/微信:13340454)
评论专区加入QQ群交流
名 称
必填
邮 箱
选填
网 址
选填
◎已有 24 人评论,微信:QQ13340454
1楼SEO算法 2018-08-02 11:15:57
数据分析是网络营销里面最重要的一环,学习了
评论来自电脑端
顶: 1踩: 0
回复
东半球更靠谱的赚钱软件1 2018-09-25 22:50:56
难得的数据分析好文
评论来自电脑端 · 中国内蒙古呼和浩特
顶: 0踩: 0
回复
2楼适合新手操作的网赚系统强势上线 2018-08-02 11:58:37
很多时候数据的价值还是蛮大的。
评论来自电脑端
顶: 1踩: 0
回复
3楼阿里下拉宝 2018-08-02 12:18:07
现在10万+的基本都是娱乐的东西,没啥好看的
评论来自电脑端
顶: 0踩: 0
回复
4楼素材火 2018-08-02 12:28:21
过眼云烟
评论来自电脑端
顶: 1踩: 0
回复
5楼公众号加粉小程序推广 2018-08-02 14:21:38
10万条怕是连个渣都分析不出来
评论来自电脑端
顶: 1踩: 0
回复
6楼那么多赚钱项目还不如这100撸的开心 2018-08-02 14:28:28
真是科学的方法论啊,实践出真理的
评论来自电脑端
顶: 0踩: 0
回复
7楼高丹SEO 2018-08-02 15:07:13
执行力才是最重要的,目标明确,坚持下去就对了。
评论来自电脑端
顶: 0踩: 0
回复
8楼p2p理财 2018-08-02 17:50:18
今日头条都能捉取?
评论来自电脑端
顶: 1踩: 0
回复
9楼钟水洲 2018-08-02 17:56:50
口头司令,,,来点实操干货!!!
评论来自电脑端
顶: 1踩: 0
回复
10楼五年口碑全能系统上线 2018-08-02 21:12:52
找到一个细分领域坚持切入是关键。
评论来自电脑端
顶: 1踩: 0
回复
11楼北京夜场招聘 2018-08-02 22:03:51
py不是谁都会的
评论来自电脑端
顶: 0踩: 0
回复
12楼梁兴健 2018-08-02 22:52:57
分析得很准确,但不是每个人都懂代码
评论来自电脑端
顶: 0踩: 0
回复
13楼日本地铁 2018-08-03 09:25:14
思路与想法不错
评论来自电脑端
顶: 0踩: 0
回复
14楼新人信赖的自动化项目 2018-08-03 11:19:07
很多时候还是数据说话。
评论来自电脑端
顶: 1踩: 0
回复
15楼传奇今生 2018-08-03 12:20:32
用数据说话,还原事实真相
评论来自电脑端
顶: 0踩: 0
回复
16楼小程序推广 2018-08-03 14:07:31
怎么也要上亿条
评论来自电脑端
顶: 0踩: 0
回复
17楼b2b电子商务平台 2018-08-03 18:27:27
头条现在转化率怎么样了,是不是很多水军在里面
评论来自电脑端
顶: 0踩: 0
回复
18楼虚拟资源项目上线并自动更新 2018-08-03 20:58:44
现在仍然是一个数据为王的时代。
评论来自电脑端
顶: 4踩: 0
回复
19楼北京夜场招聘 2018-08-05 21:12:59
py不是谁都会的
评论来自电脑端
顶: 1踩: 0
回复
20楼新手简单操作的网赚兼职 2018-08-18 06:45:06
执行起来才行
评论来自电脑端 · 中国江苏宿迁
顶: 0踩: 0
回复
21楼公证云 2018-08-19 19:57:55
怎么抓取啊,没看懂,不会代码,汗
评论来自电脑端 · 中国福建厦门
顶: 0踩: 0
回复
22楼戳进最赚钱的项目 2018-09-12 10:52:33
数据分析很重要
评论来自电脑端 · 中国山东菏泽
顶: 1踩: 0
回复
相关文章阅读更多:SEO优化 思考 自媒体
2018-05-09如何利用免费工具轻松实现个人号裂变?
2019-02-12一个程序员的自白(自负盈亏)
2018-01-31ZAC认为子域名和子目录哪个更有利于SEO?
2018-06-09轰动微博的“崔永元范冰冰”事件中的为人哲学
2019-03-08一文剖析电影“流浪地球”推广营销方式
2010-12-28北京用户访问卢松松博客办法
2018-07-07发软文,找松松!3000多个网站随便发、
2019-02-26注册松松营销中心,您可以同时登陆6大平台
卢松松
知名自媒体人,知名站长
站内搜索
请输入关键词
作者介绍
读者投稿在卢松松博客的专栏
读者投稿
提醒:以上内容均来自作者投稿,与卢松松博客观点无关,希望读者明辨是非,谨防上当受骗!版权在文章结尾处。
编辑QQ:1334045405
投稿邮箱SongSongTouGao@qq.com
http://lusongsong.com/tougao.html
7天热门
2009-2019:卢松松博客10周年
记一次“7天裂变9万会员”的项目经历
一个比较隐蔽热门的微信解封项目
爆料:因仿冒知名教育机构网站牟利千万
谈谈如何破解百家号限流之道
所谓成功人士,其实都是忽悠
百度原创保护功能疑似正式下线了
点赞最多
彩票内幕,骗了很多中国人 5003
微信应用号公测将引爆.cx域名抢注潮 3200
揭穿微信朋友圈卖东西月入几万的真相 2448
揭秘淘宝买衣服潜规则,你们吃亏吃大了! 1883
微商48种加人方法 1833
快速增加微信好友的十大方法 1288
最新文章
2019年与新媒体人密切相关的5个发展方向
如何玩好微博?
小道消息:百度推广以后都用落地页
2019最新微信养号攻略
揭秘微信“看一看”如何为一篇文章带来百万阅读量!
松松团队参加百度“安全有度 智联未来”合作伙伴大会
Copyright © 2009-2019 卢松松博客 版权所有 | 联系我们 | 发展历程 | 广告投放 | 公司简介 | 本站简介 | 站长QQ:13340454 | 粉丝交流QQ群:610272964
本站采用Z-Blog系统搭建,内容采用创作共用版权 CC BY-NC-ND/2.5/CN 许可协议
京公网安备 11011602000576号 | 京ICP备12044334号-1
0daybank
文章评论