先看如下可视化图表(双击图片放大):
感觉如何,想知道如何生成的吗,跟我操作,包你 30 分钟轻松拿下。
一、数据抓取
前段时间抓取了 2.27w 项抖音视频数据(回复抖音,下载原始数据)。
可以给大家分享下抓取思路:
目前已经有很多爬虫在抓取抖音数据了,与其自己劳神破解,直接从别人爬取结果中提取数据岂不更简单易行?
二、数据 清洗 & 处理
2.1 数据清洗
如下图,「数据」 -> 「删除重复值」 -> 根据「视频链接」字段去重即可。去重后剩余 16482 项数据。
2.2 字段拆分
需将提交时间拆分为年、月、日、时、分、秒 6 个字段。操作步骤如下:
1、在提交时间后预留 5 个空列,以防拆分后覆盖其他数据。依次选中「提交时间」列 ->「数据」 -> 「分列」。
2、选中「固定宽度」。
3、建立分列线。
4、设置数据格式。
5、完成后效果如下。
2.3 去处冗余
综合运用 分列 & 函数(SUBSTITUDE)去除「作者」列的『抖音』及『的视频』,「描述」列的『简介:』,结果如下:
此时 数据清洗 及 后期处理 已完成,下一步可进行数据可视化操作。
三、数据可视化
3.1 软件安装
此处使用的软件是 Tableau Desktop,可在其官网免费下载,试用期 15 天:
https://www.tableau.com/zh-cn/products/desktop
3.2 导入数据 & 前期设置
1、如下图,选中刚处理过的 Excel 表格并导入。
2、点击工作表标签,对左侧字段简单分组。
3.3 抖音 24 小时播放、点赞、分享、评论数分布
如下图将相应字段拖拽入坐标栏并调整顺序,然后双击并修改文本标签即得。
3.4 抖音创作者排名
3.5 抖音视频排名
教你一招:选中「作者」、「播放数」、「点赞数」,单击右上角「智能显示」,可选软件根据情境推荐的合适图表。
好了,文章开头的 3 个可视化图表均已完成,回头一看,是不是 so easy 啊?
四、其他
领取专属 10元无门槛券
私享最新 技术干货