这是数据可视化系列的第三篇文章。参见第一部分:“数据可视化解读:它是什么以及为何重要”和第二部分:“数据可视化解读:视觉变量简介”。
在下图中,您看到了多少种颜色?
大多数人看到了四种:白色、绿色和两种不同的粉红色调。实际上,那两种色调完全相同;图像中只有三种颜色。
这个流行的视错觉说明了一个在设计数据可视化时需要考虑的重要事实:选择不当的色彩组合会欺骗人眼。为了全面理解色彩,我需要深入探讨人眼的生理细节,了解我们实际上是如何“看到”颜色的。
然而,鉴于这不是一篇眼科学文章,我将专注于构建清晰数据可视化所需的基本色彩运用原则。
色相与色值的区别
在上一篇文章介绍视觉编码通道时,我提出了两个与色彩相关的不同通道:色相和色值。让我们正式讨论一下。
色相是您通常听到“颜色”这个词时想到的东西。红色、绿色、蓝色、粉色、黄色等都是不同的色相。另一方面,色值指的是单个色相的“明度”。下图展示了彩虹色的不同色值,说明了相同的色相在明度/饱和度上可以有巨大差异:
(此处为图片占位符,展示不同明度的彩虹色)
虽然这两者都可以作为有效的视觉编码(本系列上一篇文章详细讨论了视觉编码),但色值相比色相有一个显著优势:即使可视化图表以灰度打印,它仍然可以被感知。
色彩标度的类型
如果您想将色彩用作视觉编码,首先需要选择一种色彩标度。在这样做时,需要考虑几个特征:
- 如果您的数据是名义数据(分类无序),则可以使用分类色彩标度,它完全依赖于色相。
- 对于定量数据,您需要做两个额外的决定:1)您的标度是顺序的还是发散的(即,使用一种还是两种色相),以及 2)您的标度是连续的还是分为若干类别。
因此,我们有五种色彩标度可供使用,下面将全部讨论:1)顺序且无类别,2)顺序且有类别,3)发散且无类别,4)发散且有类别,以及5)分类标度。
顺序标度(一种色相)适用于可视化从低到高的数值。发散标度在数值从负到正变化,或者设计者希望强调标度两端颜色之间的差异时,会很有帮助。
当然,这些只是一般规则。根据具体的可视化需求,不同类型的标度可能是最佳选择,有时多种标度都可能适用。
顺序且无类别
下面的地图使用了一个顺序、无类别的色彩标度,说明了2011年人口普查时自认为是圣公会教徒的澳大利亚人口比例。我们可以看到,单一的绿色色相,其色值从浅到深增加。由于只有一种颜色,所以没有发散性;由于标度是连续的,所以没有类别。
(此处为图片占位符,展示澳大利亚圣公会信徒比例地图)
顺序且有类别
与上面的可视化不同,我们可以看到下面的美国地图具有离散的类别,这些类别改变了色值。它仍然是顺序的,因为只使用了粉色色相。随着县内20岁出头成年人的百分比增加,色值也随之增加。
这个可视化值得注意的一点是类别的不均匀性。(注意最大类别的宽度。)这并不总是好的做法,尤其是在没有给出理由的情况下。
(此处为图片占位符,展示美国各县年轻人比例地图)
发散、有类别和无类别
发散标度理解起来有点棘手,所以让我们在一个对比示例中一起考虑两种类型。同时,我们也能看到有类别和无类别标度的不同优势。
下面的两个图表是使用模拟数据在Python中生成的。数据包含以下视觉表示(即视觉编码通道):
- X轴:代表商店位置的编号。
- Y轴:代表一年中的月份。
- 颜色:代表虚构商店通过月度调查收集的“客户满意度得分”。
这些可视化的有类别与无类别方面,与上面顺序标度中的情况类似。在左侧(无类别)标度中,代表了值的完整范围,而在右侧(有类别)标度中,颜色代表分组的值桶。左侧可视化提供更高的精度,但右侧更易于解释和应用。
这些标度的发散方面更为复杂。让我们分解一下:
- 这里的发散标度使用两种颜色:红色和绿色(并非世界上最易访问的颜色,我们将在文章后面看到)。
- 中性白色(或有类别标度中的两种浅色)代表数据中一个逻辑上的“中间点”,在本例中是值0。
- 这个中间点是关键,因为它使得发散标度自然地适用于数据。如果数值只是朝一个方向移动,没有一个有意义的中心,使用多种颜色就没有什么意义。
分类标度
最后,也是最直接的一种色彩标度类型,是分类标度。下面的图表显示了各国政府资助的细分情况,提供了一个清晰的例子。
(此处为图片占位符,展示各国政府资助比例图表)
如果您一直在关注本章讨论的原则,您可能会注意到这不是一个设计得特别好的数据可视化。它传达了大致的要点,但使用了太多不同的颜色,导致了最终设计的混乱。
尽管如此,这是分类标度的有效运用,正确地应用了这种标度类型来处理名义数据(具有不同、无序类别的数据)。数据可视化中一个常见的错误——也是您应该注意避免的——是当您的数据显示出明显的数值增减时,却使用带有多种不同色相的分类标度。在这些情况下,请参考上面讨论的其中一种色彩标度,具体取决于您的数据。
这总结了您进行有效数据可视化所必须了解的关于色彩标度的基础知识。最后,让我们再看几个关于如何用好色彩的提示。
(不要)冗余地使用色彩
在可视化中,很容易在不需要的时候使用色彩。例如,我们经常看到条形图,明明有清晰的X轴标签来区分条形,却仍然给条形使用不同的颜色。
这并不是错误的,但可能是多余的。如果只有少数几个类别,并且它们与其他可视化相关联,那么当然可以使用色彩来提供额外的视觉提示。然而,如果可视化没有色彩也能正常工作,那就不要强行使用。
一般来说,除非为观看者提供额外的解释便利,否则应避免任何和所有冗余的编码(表示)。这要么是浪费,因为该编码通道本可用于不同的变量,要么会造成混淆,因为观看者需要判断额外的编码是否描绘了他们尚未理解的内容。
使色彩调色板具有可访问性
最后这一点很短,但极其重要。不要仅仅因为您能区分可视化中的颜色,就认为其他人也能。数据可视化应该对所有人都是可访问的,包括患有各种类型色盲的人。
例如,考虑上面关于发散色彩标度部分中的Python可视化。您认为红绿色盲的人能正确解读它吗?可能性不大。
幸运的是,我们不需要做太多额外的工作来确保我们的可视化具有可访问性。有无数在线工具可以自动检查您所选色彩调色板的可访问性。有些甚至可以帮助您生成它们。利用这些工具,使您的可视化尽可能易于访问。
最后思考
恭喜!通过本系列的第三篇文章,您已经学习了设计引人注目的数据可视化所需的基本原理。在接下来的文章中,我们将最终开始设计和构建我们自己的可视化!在那之前。
参考文献
[1] https://blog.datawrapper.de/which-color-scale-to-use-in-data-vis/
[2] https://www.nei.nih.gov/learn-about-eye-health/eye-conditions-and-diseases/color-blindness/types-color-vision-deficiency
[3] https://coolors.co/contrast-checker/112a46-acc8e5
[4] https://webaim.org/resources/contrastchecker/
[5] https://accessibleweb.com/color-contrast-checker/
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)
921

被折叠的 条评论
为什么被折叠?



