干了这碗数据可视化的鸡汤,广告营销就不用愁了?
作者: Paul Shapiro
我们市场营销人员经常与大量数据打交道,但我们如何以一种简单易理解的方式来展示这些数据呢?让我们打开天窗,探究数据可视化专栏作家保罗·夏皮罗的说法.
最近,我一直在思考数据可视化如何能被我们营销人员很好使用。
做为营销人员,我们经常要花大量的时间在电子表格上,并分析这些数据。数据的最终形式通常是漂亮的图表,图形和可视化——然而大多数的营销人员还不清楚数据可视化理论的原则。
让我们一起来探索这其中的原则,然后一起制作更好的图表吧!
为什么使用数据可视化呢?
我们的大脑有时候会很奇怪,当数据作为图表呈现时,我们更愿意通过自己的精神去处理数据然后获得见解,而不是通过EXCEL的电子表格去得出数据。正如数据可视化专家Alberto Cairo在他的书中“The Functional Art”说道:对于任何图表和可视化,其首要和最主要的目标是要其成为一个工具,从而让你的眼睛和头脑能够感知超越器官之外的事物。
例子1
为了阐释这个原则,让我们看一个真实的例子:一个名叫安斯库伯的四重奏数据集。这个数据包括四组数据,分别由罗马数字标记着,其中每一组数据都包含了x,y坐标。在Excel中,这些数据很难被分析:
如果我们通过常见的统计方法来分析这些数据,我们不难发现这些结论都非常相似。
在这样的情况下,目前仍然没有任何显著的模型或者结构,可以轻易地从这个数据中得到。但是如果我们用散点图来表示这些数据,一个全新的视野从此被打开了。
哇!当数据以图形呈现时,我们看到了这个数据很多不同的地方:
数据一,展示了一个简单的直线线性回归关系图。
数据二,展示了一个xy的非线性关系,其图形是向下的抛物线。
数据三,展示了另一个直线回归关系图,但是带有一个明显的离群值。
数据四,并没有展示出X和Y的关系,从这图中很明显我们可以看到X是一个常量8,
例子2
让我们浏览一下与营销有关的例子,如果我们用年龄和性别来区分浏览者,我们是不是很容易利用表格数据发现其中的趋势呢?
很明显,至少在我们可视化数据之前,我们不能立刻得到什么结论。因为这里一次有太多的变量要处理。
使用数据可视化后,一切都变得清晰了。从数据可知,总体来讲,很少同一个年龄组的男性会同时访问我们的主网站和子网站,但是有一个例外。不知为何,我们的子网站更受25-29岁的男性欢迎。
现在我们知道为什么数据可视化在数据分析里面这么重要了。接着,让我们一起探索一下能让我们更高效的描述数据的原则吧。
选择正确图表的科学。
让我们快速讨论一下视觉感知是如何工作的。这里有一个简单的版本可以让我们得知当我们看东西的时候发生了什么
- 我们之所以能看到东西是因为光从物体反射到人的眼睛
- 它通过感光细胞进入大脑里的视网膜,并被编码成电信号
- 现在,你的大脑可以察觉到的基本特征,也被称作前注意阶段属性
- 大脑会根据你的记忆(标志性记忆,工作记忆和长期记忆)进行更多的分析和分解信息
前注意阶段属性
让我们更详细的说明一下步骤3。前注意阶段属性是一种特定的视觉属性,这个属性可以立刻(不超过200-250毫秒)检测,并且对大脑来说毫不费力或者不需要额外的处理。
前注意阶段属性包括: 颜色,长度,宽度,方向,形状,大小,围栏,色调,密度,位置
虽然能够很快检测到前注意阶段属性,但有一些特征是能够更快被检测的。例如,相对于阴影或形状我们可以很快的知道颜色的变化,
让我们来验证一下这个理论,如果给你一个由不同数字(例如,不同形状)组成的文本块,你可以快速找出5吗?你不可能做到的。
现在,如果我们现在现在加深5的阴影,我们就可以更快的发现它们。
如果我们用完全不同的颜色表示,我们会更快的发现它们。
这是一个非常有说服力的信息。你可以将这些特征融入你的图表和可视化,基本上不需要任何心理过程,就可以帮你改善数据通信。
Cleveland & McGil的研究:为什么选择对的图表很重要
统计学家William S. Cleveland和 Robert McGill把前注意阶段属性和其他关于图形知觉研究的概念进行了一些开创性的关于数据可视化的科学研究
Cleveland and McGill开发了一个元素感知任务的层次结构,排列人们如何使用它们来解释数据。从最准确的感知到最不准的感知顺序,任务如下:
1.顺着共同刻度的定位
2.顺着非对齐、同一刻度的定位
3.长度,方向,角度
4.面积
5.体积,曲率
6.阴影,颜色的饱和度
让我们探讨一下这种层次结构如何能帮我们为数据集选择一个更好的可视化效果。
下面这个例子比较了不同产业在2010到2015年间所得到的风险投资资金
同心圆形图
我们通过圆的大小不同来表示不同产业的风险投资资金
现在,让我们用几个问题来了解这个图,当然我后面也会给你们答案,但是现在,让我们先试着回答他们吧:
- 在2015年哪一个产业收到最多的风险投资资金呢?
- 在2015年哪一个产业收到第二多的风险投资资金呢?
- 猜测一下,相对于2015年,生物科技在2012年的资金占了多少百分比呢?
- 猜测一下,相对于2015年,娱乐媒体在2012年的资金占了多少百分比呢?
把你的答案记下来,然后继续往下看,并自问同样的问题。这是同一个数据,只是表现的不同,这个时候你的答案有发生变化吗?
条形图1
这是同样的风险投资数据,只是有一点表现的不同。
条形图2
我猜你的答案已经变了-至少你想更改答案。你对这个数据更有信心。这个图表的每一次更迭都是利用了Cleveland和 McGill的层次结构里的信息,利用这些可以让你更容易理解数据。
这是最后一个图表,条形图2,这个条形图包括了真实数据
问题 :哪一个产业在2015年收到最多的风险投资资金?
答案: 生物科技。
这个最简单的问题,因为当以同心圆图表示时你也知道这个答案。然而,圆形图比条形图更难理解,因为圆型图实际上是用了”区域”而条形图用了”长度”。我们在捕捉圆的区域信息时会比较困难,所以图表的形状阻碍了我们的感知任务。
在条形图1,我们也用了”长度”,但是条形图2更容易理解。因为使用了“顺着共同刻度的定位”能让你清清楚楚看清楚生物科技所收到的风险投资资金是最多的。
问题: 哪一个产业在2015年收到第二多的风险投资资金呢?
回答: 消费产品会服务产业。这个在同心圆图里面是非常难看出来的。消费产品和服务的风险投资金的数量是48亿美元,这数字非常接近娱乐媒体的数值47亿4900万美元。如果我们想要区域来比较相似的值是很困难的。
条形图1也不是这个数据的最佳编码。在图表2中,它使用的“顺着非对齐、同一刻度的定位”(在Cleveland and McGill的层次结构中处于第二佳感知效果)表现出作为编码的小倍数不如在“顺着共同刻度的定位”(在Cleveland and McGill的层次结构里的最佳感知效果)中被感知的效果好。
猜测一下,相对于2015年,生物科技在2012年的资金占了多少百分比?
54%。在2010中,生物科技收到了398400万美元,而在2015年,它收到了740800万美元。
在同心圆图里面想要知道这些信息几乎是不可能的,因为它是使用“区域”大部分人都会错误的说成80%。
猜测一下,相对于2015年,娱乐媒体在2012年的资金占了多少百分比?
35%。在2010年,娱乐媒体产业收到了162400万美元的风险投资基金,在2015年,它收到了474900万美元的风险投资资金。
和之前那个例子一样,想要在同心圆里正确的知道这些比例是非常困难。人类不擅长捕捉一个区域里的不同点,特别是圆形的差异。大多数人都会错误的说有50%。
结论
数据可视化是艺术和科学的一部分。虽然没有所谓正确的方法来可视化一部分数据,但是,我们可以用一些概念来帮助我们用更高效的图表来可视化数据。我已经提出了这些部分原则并解释了前注意阶段属性以及如何利用Cleveland & McGil的感知层次。
下一次,如果你要在一个EXCEL中创建一个图表,制作一个报告或演示文稿,想想这些概念,它们让你的数据视觉效果大为改善。
End.