前言
今天继续APP爬虫,今天爬取的是微博榜单(24小时榜)的数据,采集的字段有:
用户id
用户地区
用户性别
用户粉丝
微博内容
发布时间
转发、评论和点赞量
该文分以下内容:
爬虫代码
用户分析
微博分析
爬虫代码
用户分析
首先对部分用户id进行可视化,字体大一点的是上榜2次的(这次统计中最多上榜的是2次)。
接着对地区进行数据处理,进行统计。可以看出,位于北京的用户是最多的(大V都在北京)。
接下来看下用户的性别比例:男性用户占多。
最后再看看上榜大V粉丝前十:
微博分析
首先,对时间数据进行处理,取出小时时间段。
接着,我们看看微博点赞前十的用户。
最后,绘制微博文章词云图。
领取专属 10元无门槛券
私享最新 技术干货