数据可视化系列文章
multiple correlation
气泡图
问题
数据源自全国法定传染病疫情概况。根据《中华人民共和国传染病防治法》,目前的法定传染病为甲、乙、丙三类共39种,国家卫生主管部门建立全国疫情报告系统,要求医师或医疗机构一经发现均需向卫生主管机关报告。因此,此类信息是高度准确和可靠的。法定传染病的发病数是按上报后的终审日期进行统计的,本例仅选用2010-2017年每年8月份的数据作为分析资料(表1)。
表1 2010-2017年全国8月部分法定传染病发病例数
注:数据源自中华人民共和国卫生和计划生育委员会网站
首先尝试利用传统统计图展示法定传染病的发病数及其排位。结果如下图所示。
图1 2010-2017年全国8月份部分法定传染病发病数及其排序
由于传统统计图缺乏自动排序功能,因此,数据中所隐含的变化趋势,难以在图中展示出来的。另外,由于使用了图例方式来注释,让读者阅读上图时需要额外的记忆功能帮助,即不记住每个法定传染病的“颜色”,就不好直观判断其发病例数多少与排位的前后。可以想象,如果选取的组分(本例仅是部分法定传染病,而不是全部法定传染病)比较多时,上图因为使用的颜色更多和直条线段更碎,阅读难度就更大了。
解决方案
1
数据准备
将原始数据输入到Excel表格中,格式如图2所示。气泡图一次只能处理一个组别的数据,以本资料为例,需要将每一年的数据都作为一个单独的数据文件。数据录入共两行,分别是病名和发病数。下面以2010年全国八月份法定传染病发病数据为例来探讨。
图2 2010年发病例数录入截屏
2
绘制气泡图
(一)启动软件
启动Power BIDesktop图标,启动PowerBI软件。在右侧“可视化”窗口的示例图标区,点击“…”选择“从文件导入”项,将已下载好的气泡图(SuperBubbles)拓展图例文件导入(图3)。
图3 气泡图拓展图例导入界面
(二)数据导入
选择开始→获取数据→选择需要的数据表格(图4),导入Excel中的数据。之后会自动跳转至一个导航器的界面(图5),选择好相应的单元表即可。导航器的界面右下方可见两个选项,如果前面创建的数据图表没有问题,就可以直接选择加载;如果想进行相关的修改,也可点击右下方的编辑按钮,便可以对数据进行修改。
图4 气泡图数据导入界面
图5 气泡图的导航器
(三)参数设置
如下图所示,将两个字段分别拖到对应的位置。
图6 气泡图参数设置
屏幕左边结果展示区域出现气泡图的雏形。之所以称之为气泡图的雏形,是因为在原始数据未排序的情况下,气泡图的疾病排列是随机的,并未按发病例数的多少顺序排列。因为气泡图本身没有排序功能,所以我们需要借助其他模板的排序功能来达到排序目的。本例中选用Power BI自带的饼图来解决排序问题,其他带有排序功能的模板也可以使用,基本原理是相同的。依次点击饼图图标和“排序依据:发病数”,将数据转换成有序图形,然后保存数据(图7)。
实际上,也可以借助导航器中右下角的“编辑”按钮,对Excel电子表格中的数据大小进行手动排序(参见图5)。当然手动排序有发生错误的风险。
图7 数据排序操作
再次打开之前保存的数据文件,然后点击气泡图的模板,成果图就会变成螺旋样气泡图了,如图8所示。
图8 螺旋样气泡图示例
在气泡图中,从占比最重的部分开始向外螺旋扩散,占比大小以圆形大小的直观方式呈现出来,即使数据差距不是十分悬殊的,圆形面积之间的对比也很明显。
按照上述同样的方法,依次利用2010至2017年的数据绘制气泡图,组合得到下图,完成数据可视化。
2010年
2011年
2012年
2013年
2014年
2015年
2016年
2017年
图9 2010-2017年全国8月份部分法定传染病危害性排序
评价
气泡图直观地展示了2010-2017年全国8月份部分法定传染病依据发病例数多少进行的危害性排序。气泡图以直观的方式显示数据之间的大小对比以及不同数据项之间的顺序关系,可以快速地吸引人的眼球,让需要传递给接受者的内容可以快速地被吸收。按照数量大小的排序,在医学领域是经常会遇到的需要。比如,各种疾病谱年度变化的比较,各医院各类患者平均住院天数排序及比较,等等,这些都需要对多组数据进行对比,气泡图大有可为之处。
原创人员:邱思奎
指导老师:黄子杰
微信编辑:张俊
领取专属 10元无门槛券
私享最新 技术干货