首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据分析之-微信好友分析

itchat

中午吃午饭的时候,无意间浏览到某公众号的一篇文章,是关于爬微信好友的。自从爬虫工程师转数据分析师以来,很久没玩过爬虫了,于是乎玩心一起,吃完饭之后自己便尝试起来。

itchat包,已经完成了wechat的个人账户API接口,使得获取个人微信信息更加方便。纯属好玩!!!

安装 itchat

在命令终端输入:

登录

分析好友相关信息获取好友信息

返回一个字典列表,第一个是本人信息。字典中的每一个key表示一个信息,如:性别,昵称。建议断点通过pycharm预览。

查看男女比例

打印的结果:

啊!这结果扎心了。微信里男的多,女的少,难道这就是单身汪的原因?好吧,下面通过直方图,来更直观的观测一下男女比例情况:

一次获取所需信息

上面是简单的单项查看,其实我们可以使用一个数据框,一次把所要分析的数据全提出来。比如这里,我们提取昵称、性别、省份、城市、个性签名。

城市分布情况

可以看到,还是有部分爱”装逼”的小伙伴,把地区写到了国外去了。

接着我们看一下人数较多的广东和湖南的具体分布情况

下图省份写错,为湖南省

好友个性签名词云图

毫无疑问,这个是最好玩的了。刚刚我们拿下来的数据里有每个好友的个性签名,接下来让我们来看看我的小伙伴们的个性签名有多个性吧!

把个性签名打印出来,发现有很多表情,还有些甚至变成了‘emoji’、‘span’等没用的字样,因此,需要使用正则表达式将这些替换掉。

执行完,我们查看一下text

接下来,就可以使用JB分词,啊?不,是结巴分词。

最后,图是出来了,以我自己头像为背景,这个头像不太好,看起来似乎不那么和谐。

好吧!我们来看看我都交了些什么样的朋友?一眼望去满满的正能量,有木有,踏实、努力的一大堆,也有些多愁善感的。

等等?保单?微粒?什么鬼?哈哈,那些在本朋友圈打广告的小伙伴,从现在开始我注意到你们了。

最后

是不是很有趣?

不过我微信好友不多,所以分析价值不大。对于那些好友上千的小伙伴们,相信你们的好友更有意思。

另外,这是第一次听到itchat这个包,还有很多其他的功能等着大家去探索,有时间有兴趣的话再慢慢摸索吧!

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180113G0OHSD00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券