智汇医圈
公众号ID:plus_community
关注
背景
“统计图形的意义在于引导我们观察到统计数据中的信息。著名统计学家John Tukey曾说:图形的最大价值就是使我们注意到我们从来没有料到过的信息”。
什么是饼图及饼图的起源?
饼图可谓是有史以来争议最大的图表类型之一,自从诞生以来毁誉参半,它是大家最常用的图表但同时又有人对此厌恶至极。饼图易于理解,但如果使用不当,这种视觉效果很容易让人产生误导。因此,我们决定仔细探讨下这类有争议的图表,以帮助大家更好地使用饼图。
饼图,或称饼状图,是一个划分为几个扇形的圆形统计图表,用于描述量、频率或百分比之间的相对关系。在饼图中,每个扇区的弧长(以及圆心角和面积)大小为其所表示的变量的比例。这些扇区合在一起刚好是一个完全的圆形。也就是说,各部份百分比之和必须是100%。顾名思义,这些扇区拼成了一个切开的饼形图案。
饼图发明之初,巧妙的创意
图1:Playfair(1801)绘制的饼图是历史上第一幅饼图,描述了法国大革命前后一些欧洲国家的统计数据。上方大图展示了各个国家的领土面积(和圆圈成比例)以及人口(左垂线)、税收(右垂线)、国土在各大洲分布比例等数据,两条垂线连线的斜率可表示税负的轻重(这一点颇有争议,因为斜率与圆的半径有关)。左下方饼图展示了土耳其帝国在三大洲的国土面积分布。
图片来源:https://infogram.com/blog/the-infamous-pie-chart-history-pros-cons-and-best-practices/?utm_medium=hao.caibaojian.com&utm_source=hao.caibaojian.com
饼图的第一个显著示例是威廉-普莱菲(William Playfair)在表示地缘政治领土面积比例时使用的,从图1中我们可以清楚地看出当时的土耳其帝国分别在亚洲、欧洲和非洲的领土面积比例。这幅图在今天看来似乎没有什么惊世骇俗之处,但在当时统计图形种类极为稀少的年代,能以这种方式清晰展示数据结构,也实属难能可贵。威廉-普莱菲给其命名为Pie Chart,Pie在英国应该算是一种很家常的食品,所以普莱菲把这种图表叫做Pie Chart,如果他是意大利人,特别是那不勒斯人,是不是得把这图叫做Pizza Chart了
#注解# 威廉-普莱菲有着统计图形奠基人之称,其是苏格兰工程师兼政治经济学家,著有《Statistical Breviary》等
被人遗忘后遇巧匠,重见天日
但这项发明在此后很长一段时间内几乎渐渐被人遗忘,直到1958年,法国土木工程师查尔斯-约瑟夫-米纳德(Charles Joseph Minard)创建了一个圆瓣地图(Divided-circle Map),图中展示了当时供应巴黎市场的肉类的数量及其比例。如下图2所示:
同道中人,英雄所见略同
著名的弗洛伦斯-南丁格尔 (Florence Nightingale,英国护士、社会改革家兼统计学家)使用极地图(最初由法国律师和业余统计学家安德烈-米歇尔-古里发明)来显示在东部地区的英国陆军死亡原因,图中每个相同角度的扇区偏离圆心的半径不同代表不同年月份死亡原因比例的大小。如下图3所示:
饼图优劣势及对饼图的批判
截至目前,饼图是最受欢迎的数据可视化格式之一。但是对于饼图的实用性,其实是有很大争论的。大部分人可能会认为饼图比较直观且生动,但数据可视化专家批评说人类大脑可以更容易地比较长度而不是角度。 反对意见主要来自于统计学家们,他们对饼图进行了激烈的批判,并且通过各种方式表达了对饼图的反感和厌恶之情,仿佛使用饼图的人就该遭千刀万剐!
他们是有充足理由的。他们认为,将饼图用于表达信息的效果很差。虽然饼图在商业领域和杂志中的使用很广泛,但正经八百的严肃的科学文献中其实很少用到饼图。为什么呢?
因为饼图用面积(甚至角度和弧度)取代了长度,这样就加大了对各个数据进行比较的难度。
1、如下图4所示,所有饼图看起来都很相似...直到我们将它们转换为条形图,然后您才能清楚地看到它们之间存在显着差异。
图4.上图是相同数据绘制的三个饼图(A、B、C)移机跟他们对应的条形图。
“在饼图中很难根据大小对比较对象进行排序,但条形图却很容易做到这一点。同样,用条形图更容易进行数据集之间的比较。但是,如果目的是在单一图表中对一个对象(饼图中的扇区)和整体(整个饼图)之间的关系进行比较,且比例接近25%的倍数(如25%或50%),饼图效果比条形图好。”
2、Wilkinson在他的The Grammar of Graphics一书里说,饼图就是把条形图放进极坐标里了。
3、Good和Hardin在他们的著作Common Errors In Statistics(And How To Avoid Them)里面给出了一原则:别用饼图,除非各部分加总的数是有科学意义且读者感兴趣的。
4、最不客气的是Edward Tufte,相信很多PPT爱好者都听说过此人,因为他是强烈批判PowerPoint的代表人物之一。作为一个统计学家,他认为“饼图很差劲,唯一比饼图差劲的就是一堆饼图“。
让他们一说,饼图真是一钱不值了,我们还是得看到饼图好的一面。“在一些特定情况下,饼图可以很有效地对信息进行展示。特别是在想要表示某个扇区在整体中所占比例,而不是对不同扇区进行比较时,这一方法十分有效”,“饼图在扇区所占比例达到总体的25%或50%时,可以很好地达到展示的目的”。
也有人认为,饼图最适合用于想特别强调某一个数值的时候,这个值显著的大于其他的值,并且具体数值并不重要的场景。
我个人比较认同这种看法。举个例子来说,看下图5,相同的数据,表示一组5个数据的构成,ABCDE,A占绝对多数。比起左边的效果,我更喜欢右边的。首先,最好只突出占大多数的A(57%),其他数据可以不显示;其次,饼图用的颜色太多容易让人看花眼,不如把次要数据都用一个不突出的颜色,而想要突出的数据用一个更抓眼球的颜色。
优劣势总结
优势
1. 显示部分与整体的关系
2. 熟悉的形状
劣势
1. 难以阅读,因为它更容易区分长度差异而不是角度差异
2. 容易被滥用/误用
饼图的历史变迁
随着时间的推移,饼图经历了许多改编和转换,最终转化为甜甜圈图、爆炸饼图、极地图、多级饼图和3D饼图等。
我们在此提供三种最广泛使用的饼图类型(经典饼图,圆环图和不规则极地图)。以下是它们的不同之处:
饼图 - 将类别的值作为整体的一部分进行比较,显示角度大小差异。
示例:本月销售的福特汽车数量
圆环图 - 通过显示长度差异来比较值,并允许空中心填充其他信息。
示例:美国各州销售甜甜圈的数量,以及甜甜圈销售最多的州的肥胖率
不规则极地图 - 通过每个段的半径长度的差异来比较数据。
示例:一年中每个月都有多少人受到流感的影响
好啦,饼图的起源及其评价我们谈完了,也看过了饼图的演变,如果你仍然决定在你的日常生活或者工作中使用饼图,那么一起来看看饼图应遵循一些最佳实践吧!
1. 建议比较最多5个类别:更多的类别将难以从视觉上感受出类别间的差异;
2. 从最大值到最小值组织你的数据:将数据从大到小排列之后将使得饼图在比较上更明显,且更容易感受出数据大小变化的差异;
3. 比较的每个切片,其大小接近0%,25%,50%,75%或100%的类别:切片大小接近这些比例,视觉上效果更明显;
4. 建议不要并排比较两个饼图,这种场景下,折线图或面积图更方便比较;
并排比较饼图将难以从视觉上看出两者饼图不同比例间的差异
5. 不要比较加起来超过100%的比率;
6. 用于整体vs部分类型的场景:参考图5;
7. 更有创意,是否可以用其它更富创意的图形代替?:数据可视化的意义在于从视觉上引导我们观察统计数据中的信息,因此总的原则是从欲观察的数据意义出发,选择视觉效果更为明显的数据可视化方法;
最佳实践
饼图的Excel/R/SPSS/SAS/Graphpad的绘制方法和代码,敬请期待下期;亦可留言告诉我们你的需求哦!
参考文献:
1.https://infogram.com/blog/the-infamous-pie-chart-history-pros-cons-and-best-practices/
2.https://zh.wikipedia.org/wiki/%E9%A5%BC%E5%9B%BE
3.https://web.archive.org/web/20061207160956/http://www.florence-nightingale.co.uk/small.htm
领取专属 10元无门槛券
私享最新 技术干货