首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

商业数据可视化秘籍

有多少人可以用一句话来总结“好”图表的标准是什么?

这是一个测试,也可能会映射一个事实:

或许很多读者曾研习过国际可视化标准和各种图表应用的技巧,但标准和技巧的内容可以罗列出数百条,当在工作中应用时,又很难逐一在脑海中闪过每条细则,而最后是否达成一张好图表,往往凭借的还是强大的个人经验...

比起基于标准规范式的方法论(rule-based),其实应该先有一个基于原则的判断逻辑(principle-based),以更宏观的方式来解决可视化问题。

这也是为什么我想要引出一个秘籍,一条黄金公式,一份让人愉悦的商业数据可视化原则:

GLAD的意义

GLAD并不是单纯地把几个字母拼凑在一起,事实上这背后有一整套逻辑。当我们在谈论数据分析时,探索性数据分析是帮助我们发现有价值的数据和洞察(Good Data and Insight),这是可视化成功的前提,再花哨的图表如果没有内在的功力,只能是金玉其外败絮其中。

解释性数据分析把有价值的数据和洞察装载入图表中,借助可视化的方式传递给决策者,可视化的设计越简洁(L)、越准确(A),越突出洞察(D),读者理解信息的速度就越快。

Good

发现有价值的数据和洞察就好比医生的工作,数据分析师是医生,公司是患者。描述型数据分析做的事情是体检,客观地检查身体各项指标情况。体检后,诊断出问题是什么,预测病情会怎样发展,开出针对性的药方,其所对应的分析类型即诊断型、预测型、和指导型。

诊断、预测、指导这三部分才是真正体现医生价值的地方,价值也是逐级提高的。而且只有对公司业务的更深入地理解,才能回答更深层次的问题。

因此,你的图表所提供的商业价值有多大,内在底蕴有多“好”(Good),只需要对照看看它属于哪个层次的分析,又解决了哪个层次的问题。

有限的数据是可以带来无限的价值的,甚至有时还能获得些人生的感悟。比如:

再比如:

Less

视觉设计大师Edward Tufte提出了数据墨水比(Data-ink Ratio)概念,对当代数据可视化的发展产生了深远的影响。他认为图表中的笔墨要尽可能最大化地展示数据信息,其他信息都应尽可能减少,从而降低对读者的信息干扰。

数据墨水比的公式是图表中用于数据的墨水量/总墨水量,一般对应到图表元素中,可以看作 (数据图形+数据标签)/ (数据图形+数据标签+其他元素)。

我个人更喜欢用“信噪比”= 信号/(信号+噪音)这个概念去理解,因为通过可视化传达的信息不仅仅是数据,还有业务洞察,像观点、结论性的信息往往需要用文字来呈现的也是至关重要。不过无论使用哪个词,最终的目的都是突出传达“信息”部分,去除那些干扰的“噪音”。

下图是一张来自信息之美的可视化获奖作品,充分体现了Less精神。Less is more , 少即是多。

Accurate

度的准确把控是影响读者理解信息速度的关键因素。有3种度,图形元素的精确度,数据的密度,显示效果的准确度(畸变因子 Lie Factor),在不同的场景下如何调节这三种度以精准地击中读者的下怀。

1)图形元素的精确度:图表的本质是由图形元素构成,不同元素在视觉上传达的精确度效果也是不同。这也是为什么条形图、折线图、散点图最为常用的原因。

2)数据的密度:数据是对某种事物的度量,它由类别(维度)和度量两部分构成。一张图表中所能够承载的数据类别(维度)和度量是有限的,我暂且把这个值称为“密度”。密度越大,读者需要解读的时间越长。

3)显示效果的准确度:

Lie factor“畸变因子”是爱德华·塔夫特(Edward R. Tufte)提出的另一个衡量指标,畸变因子=以图形显示的效果大小 / 实际数据的效果大小),即图形在表达数据变化时的失真程度。

比如下图,是IPAD3发布时的宣传画,实际数据是电池容量提升了70%,这是一个很大的飞跃。但该图更加“飞跃”,电池图形的长和宽均提高了70%,导致IPAD图形面积达到了IPAD2的2.89倍的效果,显然夸大了事实。

可视化没有绝对的答案,过于精确会浪费不必要的阅读精力,过于粗糙又可能回答不了读者的问题。掌握Accurate原则就是要做到张弛有度。

比如下图为了说明信息结论,是把所有的电影名称拿出来,还是在整体上给一个切片更好。事实上,做数据分析更有趣的体验往往是,落一叶知秋来,窥一斑见全豹。

Distinct

这是很多人忽略的一项,但却是画龙点睛的一笔。一张好图表常常会采用文字注释、视觉反差、放大字体等手法来强调突出洞察的部分。

因为读者的耐心是有限的,打动一个人的最多时间只有15秒,如果一张图表超过了15秒还没有让读者搞清楚含义是什么,必将失去继续看下去的欲望。Distinct Mark突出洞察的标识正是为了解决这个问题而存在。

在GLAD的四条原则中,D是最具有艺术性的一项,提高D值背后的思考是如何在突出洞察这件事上做到极致。

怎样运用GLAD?

“如果不能度量它,你就不能改善它。—— 彼得·德鲁克”。

GLAD原则中的每个项目都有自己针对性的衡量指标:分析的层次、信噪比(数据墨水比)、数据密度、畸变因子等等。你甚至可以像评分卡一样,为每个图表按照GLAD原则去打分,以不断地促进优化。

当然,从原则的概念理解到落地的执行,仍需要大量的技巧和工具知识来增加自己的经验。先抛个砖,还有很多秘籍,继续关注这个系列吧!

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190822A05HK200?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券