数据可视化就是将数据通过图形化的方式表示出来。即在数据的基础上,借助可视化图形描述一个或多个数据模式和用户属性。
都说一图胜千言!在大数据时代,数据可视化是支撑数据分析的重要手段之一,它可以帮助我们发现问题,并做出有效的决策。
本次分享的是我用Python3.6中的itchat、pandas、matplotlib和plotly包,对2640位微信好友进行数据分析,并把数据以图表的形式展示出来。
好友性别
对2640位好友性别做分析:男性2381位、女性227位、未知为32位。其中男性朋友是女性的10倍多,比例严重失调,估计与所处的圈子有关系,只能说活该单身和找不到女朋友。
好友标签
给好友打上标签后分析:同事660位,朋友898位,同学554位,亲属106位,客户290位、其他132位。其中朋友的基数最多,大部分是同行、粉丝、读者、普通朋友和同业余爱好小伙伴。
好友比例
对好友比例分析,同事占25.0%,朋友占34.0%,同学占21.0%,亲属占4.0%,客户占11.0%,其他占5.0%。其中朋友比例占总数的三分之一,估计是人脉圈子积累的一个过程。
好友趋势
在近半年,按月份统计好友的变动情况,并用柱状图和折现图来表示。柱状图表示每月好友总数,其中1月2018位,2月2240位,3月2449位,4月2512位,5月2610位,6月2640位。折现图表示每月新增好友数,其中1月180位,2月222位,3月209位,4月63位,5月98位,6月30位。
好友城市分布
好友所属城市按数量排名Top前6的位深圳723位、北京662位、广州436位、上海302位、杭州288位和郴州267位。其中深圳好友最多,应该与我工作的城市有关系,毕竟毕业后在这边也待5年多了。
朋友圈内容条数
在近一个月中,按周统计好友发布朋友圈条数,其中第一周33000条,第二周35600条,第三周26200条,第四周27800条。其中第二周发布内容最多,平均每人每天将近2条。
朋友圈内容类型
给朋友圈内容打上标签后,发布的内容类型为孩子、旅游、美食、工作、自拍、创业、恋爱与广告。其中广告、自拍、创业和美食的权重比占前四,看来广告这个流毒是最致命的。
数据可视化是一个强有力的分析工具,可以让数据呈现得更直观、更简单。做数据可视化,首先要获取用户数据,其次对数据进行清洗与分析,最后以图形化的形式展示。
简而言之,数据可视化就是给用户打标签,分析用户行为,通过可视化洞察数据,并从中发现规律和制定策略。
领取专属 10元无门槛券
私享最新 技术干货