推荐原因 本文详细讨论了在数据可视化上的两种不同思路:

  1. 将数据直观呈现,如同警方的报告一般,条理清晰;
  2. 将数据呈现与故事性、游戏性结合,如果侦探小说一般,妙趣横生; 如何选择合适的数据可视化呢?本文会给你带来不一样的思考。

据调查显示,用于观察相关性问题的散点图因为其内涵清晰直观易理解而被广泛使用,不过令人奇怪的是,一些需要读者花时间去探索图表内涵的数据可视化图表同样也得倒了广泛的认可。

下面我们以信息设计师 Will Burtin 在1951年创建的可视化图表为例,带大家深入了解上述两者的差异。

https://oss-images-qyum.oss-cn-zhangjiakou.aliyuncs.com/undefinedwave-docs-侦探小说-1.png

上图表示的是三种不同的抗生素——青霉素、新霉素和链霉素治疗十三种细菌的效果,其中细菌种类以圆形布局排列,每一种细菌感染区间的三个条形代表治疗它所需的每种抗生素的量。倒置的比例条表示条形越长,抗生素对细菌的抑制作用越有效。再根据背景色的不同,把细菌按照阳性和阴性分为两组。

# 可视化就像侦探小说

对于科学家而言,他们会对一些奇特的现象感到兴奋,并尝试用科学去解释。就像是在看到上图所示的太阳纹设计时,他们会被新颖的设计吸引从而去试着理解原理。

在分析拆解的过程中,他们发现较复杂的可视化的设计就好比侦探小说的叙事一样,叙事就涉及情节与视角、事件与解释、故事情节与人物之间的关系;与之类比,可视化就可以被看做是数据与模型之间的关系,数据是客观事实,模型则是人物。在叙事时,人物的观点和假设就决定了故事所要传达给观众的意思。同样地在数据可视化时,通过选择不同的数据模型突出某种比较,传递给读者特定的图表信息。

这种把可视化理解为模式选择以及突出某种比较的方式,对于图表制作者而言,既能对现有的可视化图形设计更好的逆向分析拆解,又能帮助开发更有效的可视化。

# 可视化就像是电子游戏

Burtin 可视化图表主要是想表示抗生素能治疗哪些细菌以及治疗的效果,要想发现图表所做的比较信息,读者就需要主动地去发掘。就像叙事一样,只不过不同形式的叙事方式需要观众的参与程度有所差异,例如电影需要观众相对被动的参与,电视剧需要更积极的参与,而看小说就需要观众全身心的投入。

而本例中的可视化也是如此,需要读者的深度的参与。当然也有差异,就比如某些艺术作品中,会故意含糊不清,让人难以理解。真正具有挑战性的可视化是可以被理解的,就像是电子游戏,它可以唤起读者主动学习的欲望,搭配赏心悦目的色彩与形状,从而帮助读者更好的理解。

# 可视化的表示不一定要花里胡哨

相较于 Burtin 制作的具有强烈视觉效果的可视化图表,下图所示的平坦曲线图,就比较朴素。只通过一个简单的谜题,既有效的吸引了读者的注意力,又清晰的表达了图表突出比较的信息。

https://oss-images-qyum.oss-cn-zhangjiakou.aliyuncs.com/undefinedwave-docs-侦探小说-2.png

另外一种比较流行的表示方式就是用移动的小点来模拟传染病的传播,如下图所示。

https://oss-images-qyum.oss-cn-zhangjiakou.aliyuncs.com/undefinedwave-docs-侦探小说-3.png

# 可视化需要平衡期望与惊喜

音乐之所以让人陶醉其中,就是它很好的平衡了我们的期待与惊喜,比如一个出人意料的音符就会让人感觉很有趣;讲故事也是如此,在现有的基础上给我们意想不到的惊喜。当然这也包括科学,但是在科学中,观众期望先了解背景。

对于可视化而言,这个过程往往是隐性的。期望首先由设计者对模型的选择而产生,其次是通过观众自己的主观理解而产生。设计者对模型的选择可以反映在他们选择强调数据集的哪些方面以及如何描绘,就比如以直方图的方式呈现数据,会诱导人们与熟悉的参考形状进行比较。如下图的对称钟型曲线。

https://oss-images-qyum.oss-cn-zhangjiakou.aliyuncs.com/undefinedwave-docs-侦探小说-4.png

最有效的图表既能预测又能塑造预期,一般地,我们制作图表有两个原因:学习意想不到的东西(统计学术语中的 "探索性数据分析",即 “exploratory data analysis,” in statistics jargon )和向他人传达发现结果。虽然可视化发生在空间上,而音乐和故事是在时间上展开的,但它们都需要平衡期望与惊喜。就算是最无聊最传统的可视化,都至少得暗示一些不可预见的可能。

# 可视化因目的不同而表现形式不同

在 Burtin 做出可视化图表30年后,因为其可视化的数据集发生了变化,科学家们才意识到 Burtin 的可视化图表存在的错误。然后统计学家 Howard Wainer 和 Shaun Lysen 就提出了一个假设:如果 Burtin 构建了一个更直接、更统计的数据集图形,例如分组条形图;这些科学错误是否会被更早地发现呢?

在2009年 Lawrence Finer 和 Christian Ryan 发表了一个更传统的散点图;Burtin 的可视化选择强调抗生素的有效性比较,而新的设计则优先考虑细菌之间的比较。

https://oss-images-qyum.oss-cn-zhangjiakou.aliyuncs.com/undefinedwave-docs-侦探小说-5.png

Burtin 的可视化很容易被认为是一个太过于重视视觉效应而忽略数据变化的错误方法,但是有可能 Lawrence Finer 和 Christian Ryan 的比较也是有缺陷的。这就像将侦探故事与警方报告相比较一样。它们可能叙述的是同一事件,但它们的目的却不同。

# 可视化的未来展望

那么有没有可能用一种单一的可视化同时实现上述两种比较吗?科学家们都被这种简约的设计所吸引,这种解决方案可以满足所有的需求;另一方面,可视化设计充满了权衡。

相反,那些希望传达数据的人应该考虑他们的意图,着重表现什么以及需要舍弃哪些方面。最理想的状态就是尝试将所有的内容——侦探故事和警方报告,都包含在一个单一的、交互式的在线演示中,我们称之为 "点击式解决方案"。

通过理解可视化代表的比较,可以增强任何视图的观看效果,并因此可以增强其构造。对于科学家,如果想要超越 "显示数据 "的概念来考虑我们想要呈现的模型,包括可以隐式比较数据的参考,就可以制作出更好的图形。而对于科学信息的消费者,就可以更好地阅读信息图表。

想要了解更多内容,请点击此处访问原文

Is Your Chart a Detective Story? Or a Police Report?