先占个坑,先写个大概的内容,得空后再补充完整的。
之前花了不少时间采集了2017年1月1日到17年12月6日今日头条上阅读量和评论量前100的文章,具体数据如下:
总共1000条数据,有标题、评论数量、阅读数数量、文章类型、发布时间等维度。分析的主要点:
1、文章标题都包含哪些方面内容?
2、文章标题的情感倾向是什么?
3、文章内容主要讲的是什么?
4、文章阅读量和评论量之间的关系?
文章类型分布
文章评论量和阅读量,红色虚线是阅读量,蓝色实线是评论量
阅读量和评论量散点图分布
文章情感色彩分析,其中62.8%是正面内容
文章标题标题分词