第九章 随时间变化
说到与数据交流,时间就是一切,并且时间是一个无法忽略的因素。举个例子,我们看网络上、印刷品上或办公室里的任何数据展示的时候,你往往不需要很费力就能看出时间的要素存在。还有一些比如月度失业率,季度每股收益,周末票房最高的电影等数据分析结果,如果时间元素没有在某个地方被明确表示出来,那么整个结果就失去了应有的价值。
但是,如果我们考虑到去分析一些结果是如何变化的或正在变化的,以及一些变量可能会随着时间的推移而变化,考虑这个过程而不仅仅看时间元素本身而是动态的,我们就可以开启一个全新的视角:
•情况是在好转还是恶化,还是在继续恶化?
•时间是否以不同的方式反映一个变量?
•在特定时间段内,数据是否存在趋势、异常值或变化?
•随时间变化的程度是显著的还是平缓的?
这些都是在与数据交流时关于时间的核心问题。随着时间的推移,有很多方法可以用来反映变化,我们将在本章中展示其中的一些方法,首先从简单而有效的折线图开始。
9.1 时间图表的起源
苏格兰工程师、政治经济学家威廉•普莱费尔(William Playfair)在1786年发明了折线图,当时他在自己的著作《商业与政治地图集》(the Commercial and political Atlas)中描绘了各国之间的贸易平衡。
图表 9-1-1
这里描述了两行数据,显示了随时间变化而产生的变化。我们已经习惯了如今看到的折线图,但是当看到以这种方式画出的图表反倒是很新奇。然而折线图的年龄甚至还没有美国大。威廉·普莱费尔肩负着先驱者的任务,要把他这种新的数据展示模式介绍给当时的人们。
关于线图,我们来看几个例子。
9.2 线图
我们知道,电商行业是用数据的“大户”,因为其交易属性都为数字化交易。我们首先来看一个简单的数据表格。维度是大家熟悉的时间(月份)和新老客客单价及课件数数据。
图表9-2- 1
为了创建一个线图,我们可以登录DataFocus系统,导入数据后,在左侧双击“月份”和其它任意维度,并在右侧图形转换按钮中选择“折线图”,创建随时间变化的折线图。
图表9-2- 2
那么如何去表达或演绎它呢,在图中我们可以看到,系统已经给出了最大值和最小值,以及可以作为benchmark(标杆线)的平均值。在11月客件数达到了最大值,因为双十一的关系,同理6月亦然。在此图我们只要表达出变化的极值就可以。
图表9-2- 3
而我们看客单价,是不断在变化的。11月之后就相对的一直走低,并在9月开始涨势迅猛,在11月到达了顶点,客单价为55元。类似这种变化较明显的线图,需要表示它的涨跌行为以及峰谷值。
甚至我们可以使用组合图来分析客单价和客件数的相关趋势,点击右侧图形转换按钮,点击组合图。在右侧维度上单击可转换为折线或柱状图,并且可以点击右侧坐标轴按钮,将客件数设置为单独的Y轴以便查看。
图表9-2- 4
图表9-2- 5
这样我们就能得到一张组合图,可以看到6月虽然客单价偏低,但是客件数较高,可以尝试用一些关联商品的方式提高客单价。
9.3 双轴线图
上述最后一张图表我们展示了组合图的表达方式,使用柱状图和折线图去表达两个维度之间的关系,以便找到最优解。事实上,很多场景上我们还可以利用双轴折线图来表达。我们举一个生活中的例子。作为一个笔记本产品经理,对比同类型同定位的竞品品牌和型号参数是非常重要的,我们列举一些平价的商务触控或轻薄笔记本的数据,如下图表格所示。
图表9-3- 1
对于很多女生或者学生党来说,她们除了外观、大小等参数之外,最重视的还是笔记本的价格、厚度和重量。后两者一般来说成正比,因此我们可以抓取其中一个进行分析,比如厚度。打开DataFocus,导入数据,双击“型号”、“厚度”和“价格”进行分析,右侧“图形转换”按钮选择折线图,系统将自动生成两条折线图。并且按照上述组合图的方法,将其中一个维度设置为右Y轴,便可得到想要的双轴折线图。
图表9-3- 2
我们可以看到两条曲线,上方为厚度曲线,下方为价格曲线,两者的数据表现都应是“谷值”约高越好,也就是数值越小越好。首先可以来看有“峰谷”表现的,或者说两者数值一高一低的款式,这是最容易让消费者纠结的,需要取舍。微软的Surface Book 2是上述选择中最厚的笔记本,但却拥有较低的价格,有同样“峰谷”表现的还有惠普的幽灵i5款。而“双低”表现的有XPS 13的i515寸和i7触控版本,因此如果只看重这两个维度的消费者,XPS 13的两款笔记本是较匹配的选择。
当然,为了更精确地查看数值进行对比,我们除了将鼠标移上去悬停之外,还可以点击右侧“显示数据标签”按钮。
图表9-3- 3
那么同样的,对于时间来说,双轴折线图同样适用,比如我们研究电商里的付款周期。可用于对比不同付款周期人数占比随时间的变化。
图表9-3- 4
9.4 按季节或其他时间变化的数据类型
所以说到时间变化,我们少不了研究按日期分析的类型以及有些时候的季节性反映情况。如果对于本地数据来说,我们需要提前养成良好习惯,将日期类型的数据提前设置属性。我们以最常出错的EXCEL为例,如若不设置,EXCEL默认将日期格式设置为“字符串”类型,因此我们有时需要进行手动设置,才能更好的用各类BI系统进行分析。
图表9-4- 1
打开DataFocus,导入数据,我们以上图付款周期分析为例,如要查看每月付款周期在10分钟以内的人数占比,则可以双击10分钟以内,然后在搜索框键入“按月统计的”进行分析。
图表9-4- 2
如图所示,系统会自动展示每月的付款周期在10分钟以内的占比。可以明显看到4月的此类人数占比最低而11月最高,继而我们可以把它一键转化为折线图,以更好的查看趋势。
图表9-4- 3
我们都知道,很多公司都会做季度总结或季度分析,我们可以框取我们需要的月份,以单独分析,比如我们要分析第四季度,就可以框取9-12月的距离进行放大查看。
图表9-4- 4
图表9-4- 5
除了上述“按月”的时间关键词搜索,还可以进行如下关于时间的其他关键词搜索:
每年/每季度/每月 10分钟以内
按月统计 10分钟以内
2019(具体年份)10分钟以内—>2019 10分钟以内 9月(加上具体月份)
按周日期统计 10分钟以内
周三(具体周几) 10分钟以内
在"2019/04/01" 和"2019/05/01" 之间的10分钟以内
环比:按 日期 计算的 10分钟以内的总和 的月/季度/周/年增长率
同比:按 日期 计算的 10分钟以内的总和 的月/季度/周/年增长率
9.5 时间线
说到时间线,我们再说个故事。英国神学家和化学家约瑟夫·普里斯特利(Joseph Priestley)在威廉·普莱费尔(William Playfair)的“时间线”(line plot)问世20年前,创造了已知的首条时间线,其中每条线代表一位历史上有影响力人物的一生。
图表 9-5- 1
对我们现在的应用场景来说,这似乎是描述这类信息的一种相当便捷的方式,但对普里斯特利的读者来说,这是一种创新。在我们这个时代,像这样的时间线在项目管理中被广泛使用,DataFocus也包含很多反映时间线的图形,我们以目前最流行的瀑布图为例。
还是使用付款周期案例,点击右侧“图形转换”按钮,选择“瀑布图”,即可将上一节的内容进行转换。
图表 9-5- 2
我们可以看到随时间变化的付款周期比率变化。其中变化最大的是11月,也就是双十一期间。可以看出整个付款周期还是比较健康的,没有坏值。同样的,处理时序数据,还可以使用DataFocus图形转换—高级图形中的时序图系列。
9.6 平行图
平行图是通过通过绘制平行坐标来查看多维数据中的模式,使用平行图,我们可以直观表示数据表中的各个单元格。在平行图中绘制表示数据表中各行的相连线段。平行图最初由 Inselberg (1985) 开发,后来由 Wegman (1990) 推广使用。
我们还是以刚才的客单价/客件数为例,打开DataFocus系统,导入数据后在右侧“图形转换”按钮中的高级图形当中选择“平行图”。如下图所示:
图表 9-6- 1
图中可通过每月折线的“上升和下降”清晰洞察每月客单价和客件数的情况,要注意的是,平行图中的每个单元格需存在相关性,和业务场景相匹配,否则是无效且容易误导的,比如下图中,内存、尺寸、厚度等维度相互独立并不关联,中间的“连线”毫无意义。
图表 9-6- 2
领取专属 10元无门槛券
私享最新 技术干货