很多文章都指出词云图的‘弊大于利’,如Marti A. Hearst在Stephen Few的Visual Business Intelligence Newsletter发表的署名为‘标签云怎么样’的文章。从我个人看来,词云的优点和不足之处总结如下:
好的方面
他们在信息图表和PPT中是吸引眼球的元素,相比其他如条形图更能吸引注意力;
词云提供了某种程度的‘第一印象’,最常使用的词会一目了然;
可以从不同维度展现数据:词汇本身、频率(词汇大小)、以及词汇的颜色;
在某些仪表板上可以作为highlight和过滤数据的导航元素;
它们很流行,尽管更像是一种现象,不过仍然可作为一种优点吧。
不好的方面
相同大小的词汇很难比较,不像条形图可以创建参考线,人眼不擅长于分辨区域活词汇的大小;
越长的词汇需要越多的空间展示,因此看起来比较短的词汇有更大的权重,尽管实际上他们是一样的;
在报表上很占用排版空间;
词汇的排列要么是随机,要么根据某种算法。属于同一类型的词汇分布可能会相距很远,并且小一点的词汇可能会被忽略。
有没有更好的选择?
答案是有的!
选择1:Tree Map
显然,Tableau更倾向于用户使用Tree Map. 如果你把Marks type设置成自动,然后拖动词汇到文本控制,以及词汇count到大小控制,Tableau就会自动显示一个Tree Map.因此我的建议是使用Tree Map而不是词云图。
选择2: 条形图
这听起来可能会比较无趣和古板,但是和前两者不同的是,条形图可以创建一个参考线,因此使得数据比较更加容易理解。另外,数据的排列顺序也有寓意,Tree Map(勉强可以吧)和词云显然难以做到这点。
我的结论
词云在信息图表和PPT中是吸引眼球的视觉元素,但在严谨的商业数据分析和可视化方面并无立足之处。
领取专属 10元无门槛券
私享最新 技术干货