颜色选择对于数据可视化原来这么重要!

0 评论 3442 浏览 7 收藏 13 分钟

在数据可视化设计中,不少人可能都会踩入色彩误区。这个时候,你可能需要了解一些颜色选择的技巧,以提升数据可视化效果。本篇文章里,作者就做了经验总结,一起来看看吧,或许可以帮你更好地理解颜色在设计中的作用。

可视化可以提供比查看原始形式的数据更有影响力和直观的感觉。大量的可视化工具和图表类型可以帮助以不同的方式传达数据,其中许多对特定类型的数据特别有用。虽然在选择可视化类型时可能要花很多心思,但考虑使用的颜色也很重要。

一、色彩的影响

1. 为什么要使用它?

颜色除了让视觉效果美观之外,还有其他作用。目的之一是在受制于三维空间的世界中增加立体感。虽然存在高维物体的三维投影,如🔗tesseract,但这个概念对人类的大脑来说是非常难以理解的。因此,我们不得不发挥一点创造力。允许颜色( 与大小、形状等一起 )以非空间的方式传达额外的数据维度。

色图,有时也被称为调色板,是在一个特定的可视化或一组可视化中,作为一个更广泛的主题使用的不同颜色值的阵列。仅仅受显示器可以显示的颜色数量( 基于 RGB 颜色模型的约 1680 万种 )的限制,并不缺乏不同的可能的色图。然而,并不是所有的色图都是数据可视化的可行候选者。例如,下面的热图( x 轴和 y 轴无关)。

颜色选择对于数据可视化原来这么重要!

Seaborn“选择调色板”教程中来自 Michael Waskom 所拍摄的照片

教程中是否可以立即看出每种颜色相对于其他颜色所代表的价值?使用完全相同的数据和不同的颜色图,可以得到以下结果。

颜色选择对于数据可视化原来这么重要!

Seaborn“选择调色板”教程中来自 Michael Waskom 所拍摄的照片

教程中即使没有图例可以参考( 为了本示例而特意在两张图片中隐瞒了图例 ),第二张图片对每个颜色值的相对差异提供了更清晰和直观的感觉。对于那些好奇的人来说,你可以在 Seaborn 的 “选择调色板 “教程中查看两张图片的并排比较,以及它们的图例。

以下内容来自作者推荐的链接:

色调变化不太适合表示数据。考虑这个例子,我们需要颜色来表示双变量直方图中的计数。在左侧,我们使用了一个圆形颜色图,其中每个箱内观察数量的逐渐变化对应于色调的逐渐变化。在右侧,我们使用一个调色板,该调色板使用更亮的颜色来表示具有更大计数的箱:

颜色选择对于数据可视化原来这么重要!

使用基于色调的调色板,很难确定双变量分布的形状。相反,亮度调色板使得存在两个突出的峰值更加清楚。

变化的亮度有助于查看数据中的结构,并且亮度的变化可以更直观地处理为重要性的变化。但是右边的图没有使用灰度色图。它的色彩使它更有趣,微妙的色调变化增加了两个值之间的感知距离。因此,小的差异稍微容易解决。

2. 色盲人士的色图

在数据可视化中加入直观的色图是一个非常有用的工具,但有一个主要的缺点:对于那些不能区分颜色的人来说,颜色所传达的信息就会丢失

总部位于英国的色盲宣传组织的数据表明,全世界大约有 8% 的男性和 0.5% 的女性有某种形式的 色觉缺陷(CVD)。幸运的是,某些经过科学推导的色彩图谱已经被创造出来,它们能够在各种不同类型的色盲中保持可辨识性。下面显示了几个这样的色图及其相应的 CVD 调整感知。

颜色选择对于数据可视化原来这么重要!

照片来自 Fabio Crameri、Grace E. Shephard 和 Philip J. Heron 的“科学传播中的色彩误用”

除了非 CVD 视力外,这些色图中的每一个都为不同类型的色觉缺陷( 包括完全色盲 )提供了一个合乎逻辑和连续的尺度。相反,使用色图的视觉效果如果没有牢记这些信息,就容易给 CVD 读者带来困惑。

颜色选择对于数据可视化原来这么重要!

正如在上面最右边的色阶感知( 完全色盲 )中所看到的,使用彩虹颜色贴图在光谱的相反两端创建了重复值。可见光光谱中几乎所有颜色的色图都经常被使用,正因如此,应该在很大程度上避免给 CVD 读者使用。

二、进一步举例

鉴于颜色和可视化类型都非常多,列出一份详尽的建议清单来说明如何有目的地选择颜色是不现实的。下面的例子是为了涵盖一些 在可视化中使用颜色时最常见的错误

1. 不必要的颜色使用

在某些情况下,颜色的使用会减弱数据可视化的整体价值,因为它在没有信息的地方传达了信息。虽然下面的图表确实使用了科学的、对心血管疾病有利的颜色图(viridis),但由于 X 轴标签的存在,其使用是混乱和多余的。如果将条形图改为单一颜色,去掉图例,并将 X 轴的标题改为“品牌”,而不是不准确的“mpg”,那么这个图表就会更容易被理解。

颜色选择对于数据可视化原来这么重要!

图片来源:AbdulMajedRaja from programmingwithr.com

为原创作者辩护,这张图的主要目的是围绕着操作色图以适应不同的数据,而不一定是创造一个完全准确的图表。然而,这是一个通过使用颜色给数据可视化增加不必要维度的典型例子。

2. 非直观的颜色

语境很重要。以非直观的方式使用与特定价值观有强烈关联的颜色,也会使可视化变得混乱和难以解释。对于熟悉美国政治的人来说,下面这张 2020 年总统选举结果的地图看起来应该很不对劲( 图中共和党是蓝色,民主党是红色。实则在美国,红色代表共和党,蓝色代表民主党 ):

颜色选择对于数据可视化原来这么重要!

我使用 270towin.com 创建的照片

这种直觉反应是针对民主党与蓝色、共和党与红色的关联而言的。然而,鉴于图例,这张地图在技术上是 100% 准确的。虽然这个具体的例子特别极端,不太可能无意中发生,但这个普遍的问题是在创建可视化时需要考虑的问题。

3. 只有红色和绿色

许多涉及到对“是”/“否”或“支持”/“反对”问题的信息可视化,都使用了如下图所示的红和绿。在西方文化中,考虑到“是”/“支持”/“向上”与绿色,“否”/“反对”/“向下”与红色的关联,这些颜色具有直观的意义( 附带说明:这种动态在许多东方文化中是相反的 )。

然而,由于红绿色盲是最常见的色觉缺陷,使用这种颜色会严重阻碍全球相当一部分人能够有效地理解可视化。简单地将颜色图换成避免心血管疾病相关问题的颜色,就能在不影响可视化质量的情况下提高可访问性。

颜色选择对于数据可视化原来这么重要!

照片:Niall McCarthy 来自 Statista(🔗) – 原始数据来自 YouGovResources

幸运的是,对于数据可视化创建者来说,开源社区已经创建了许多工具和资源,使任务变得更加简单。下面列出了这些工具和资源中的几个。

  • Matplotlib:最流行的 Python 可视化库之一,包括许多不同的科学衍生色图。
  • Seaborn:建立在 Matplotlib 之上,这个库包括一些额外的色图,并使其他样式方法变得轻而易举。
  • Colorbrewer:特别关注于制图可视化,这个网站允许选择不同色图,并有过滤选项,只选择那些对 CVD 安全和/或打印机友好的色图。
  • Fabio Crameri:不同色图的集合,来自启发本文的论文作者之一( 见下文的致谢部分 )。
  • Colorgorical:一个有用的工具,用于创建具有独特参数的色图,如感知距离、名称差异、配对偏好、名称唯一性等。
  • CCC-Tool:一个用于创建和导出具有高级功能的色图的工具,如指定插值方法、色差指标和优化。

鸣谢:本文的灵感主要来自于 Fabio Crameri、Grace E. Shephard 和 Philip J. Heron 的所著的《科学传播中色彩的滥用》一文,该文在《自然-通讯》杂志上发布。

对于那些寻求更深入、更科学的方法来解决这个问题的人,我强烈建议阅读他们的论文。

原文作者:T.J. Kyner(本文翻译已获得作者的正式授权)

原文:https://uxdesign.cc/data-visualizations-choosing-colors-with-purpose-4a672ac0215a

译者:李玥琪;审核:李泽慧;编辑:孙淑雅、李莉好;微信公众号:TCC翻译情报局(ID:TCC-design);连接知识,了解全球精选设计干货。

本文由@TCC翻译情报局 翻译发布于人人都是产品经理,未经许可,禁止转载。

题图来自 Unsplash,基于 CC0 协议。

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!