Reload Original PagePrint PageEmail Page

关于可视化的五大误区 by Nathan Yau@FlowingData | 视物

FlowingData的 作者Nathan Yau最近受邀去美国国家统计局指导帮助他们做数据可视化。这段经历让他感慨颇多,于是在FlowingData上发文讨论了他在和统计局的专家们讨论时 注意到的可视化的五大误区。我们看了也心有戚戚焉。于是决定把原文大致翻译一些,分享给大家,一起讨论讨论。原文在这 里。 下面文中[ ]里的部分是小编的感想。

可视化让数据更炫

这 个恐怕是最常见的误解了。在看了众多可视化和信息图后,绝大多数人都很自然的想要让自己的数据也变成那样。于是人们最常问我的问题就是:”我有怎么样怎么 样的数据,有什么好的可视化方法可以让他们看起来更炫呢?“ 不管你花多少时间让图标更好看,让图更精致,如果你只有五个数据点,就别想了。一个可视化之所以有意思,是因为背后的数据有意思。

比如,大家都非常喜欢我制作的可视化:沃尔玛的扩张。这个可视化充分展现了沃尔玛的扩张策略:在一个地方落地生根,然后迅速向附近地区蔓延。尽管我花了不少时间美化这个可视化,但是Toby Segaran的原始版本一样展示了类似的信息,也很有意思。再来看看另一个可视化:Taget的扩张。它用了一模一样的可视化,但是就不那么有意思了。因为Target的扩张并没有象沃尔玛那样有策略。

对于可视化来说,首要的一定是数据。可视化之所以有趣是因为它能展现简单的数据列表所不能表现的信息。

[小 编:我们对这个非常同意。其实一个可视化的有趣程度是有极限的,而这个极限就是它背后数据的有趣程度。好比就是一个信息传递的管道。信号源就是背后的数 据,接受端就是读者。信息多多少少会在传递中丢失。我们制作可视化的目标就是要一方面尽量减少信息丢失,另一方面选择传递最有价值的信息。]

软件和工具无所不能

有 各种各样的可视化工具。至于哪个最好,还得是具体问题具体分析。我最常用的是R和Illustrator。最近,我开始学习使用JavaScript。工 具的灵活性对我来说非常重要。我想要能最大限度的定制最后生成的可视化和用户交互。我的可视化通常是为一般读者设计的。但如果我是一个处理海量数据的分析 师,可能会选择不同的方法。我要说的是,并没有一款万能的工具可以包办一切。有些工具适合用来做数据分析,有的则适合来描述一个故事。

[小编:我们常被问道的一个问题就是,用哪个软件来可视化?我总是支支吾吾说不清楚。这个真的是要看你有什么样的数据,想做什么样的分析,提供什么样的可视化。]

一个图里信息越多越好

人们最常犯的错误就是在他们的可视化里面堆砌了太多的信息。我完全赞成在可视化中提供足够的背景信息,并且标注出有意思的数据点。但是凡事总有限度,必要的时候不如把一个复杂的图一分为二。
有 人尝试在通过加多个坐标轴,或者用大量的视觉线索(visual cues)让一个图表能包含更多的信息。有时候是可以的。但是更多的时候,这并不可行。通常,一个简单清楚的图更有效。我最常做的事就是给一个既不了解这 个数据,也不懂可视化的路人看我的可视化。问问他们从中得到了什么信息。

[小编:可视化和写文章一样。讲究的是朴中见色,以简胜繁。小时候语文课本里说,白居易写完诗总是拿给老妇人读,看看她能不能读懂。我们做可视化是不是也该这样呢?]

可视化是主观片面的,所以沒有用。

可 视化的过程中不可避免的总是有设计师的主观意识。比如选择显示哪部分数据,选择用什么样的方式可视化。但是如果你理解你处理的数据,诚实的对待信息,就能 避免犯主观片面的错误。其实,哪怕数学统计某种程度上也是主观的。因为你选择了要分析的数据和分析方法,最后写报告的时候也选择了要说的结论。
新闻媒体每天都在面对这样的问题。他们要理解数据,进行选题。建议看看纽约时报的可视化,看看他们是怎样客观的描述数据的。

[小编:这个问题在于尺度掌握的问题。好比纪录片,没有导演主观意识的片子就是监控录像。但是主观意识太强就会扭曲事实了。]

可视化一定要精确

如 果你在可视化中显示了每一个数据的精确值和标准误差,这个可视化恐怕不怎么样。准确是重要的。但是可视化并不是关于某一个孤立的数据的。更多的是展现数据 在时间和空间上的分布和变化。我们要展现的是数据中潜在的特征。所以我们在可视化的时候真正要做的是比较和抽象。如果你需要看到每个数据点,那把所有数字 放在一个列表里显然更合适。

[小编:你在做可视化的时候,有没有进入这些误区呢?或者有别的什么困惑呢?]

© 2011, 视物 | 致知. All rights reserved.

Related Posts: