数据可视化

1.用户角色决定数据的视角
数据需围绕用户的角色来组织信息结构与线框图,不同角色都有自己独特的工作流程和对数据的需求。通过角色来组织数据,会防止跑题。
2.制作页面模型
首先为用户呈现他们需要的,再将页面余下的信息根据用户故事或信息级别,进行结构化处理。如果一开始就使人分心,那么用户不仅难以分辨每个元素是什么,也难以集中精力于整个流程。

给画板创建某种结构前,问问自己“我到底要表达什么样的故事呢?“。


数据可视化
页面模型版式.png

最关键的一点 - 避免创造令人一知半解的图形,为页面信息建立模型,首先给用户呈现关键信息,然后才是支撑内容。

3.选择正确的图形

原始数据

未经处理的原始数据表格一点也没有吸引力,但它是最佳的起点。它帮助你开始思考数据中那些变量可用,这些数据变量如何关联。原始数据的单调却会帮你思考系统中各种变量间的关联。

处理离散数据和连续数据

离散数据 - 数值可清晰计数,如进球数或点赞数。
连续数据 - 任何范围值,如一季度的降水量,一个人的身高体重。

柱状图最适合表现离散数据,曲线图最适合表现连续数据。

4.基本或定制化的图形

对于实用主义来说,数据的有效性胜过它的视觉特征。

在重要信息上,文字总结可能比图标更有效果。


1.上下文的重要性

数据可视化的成功并不始于数据可视化,起始在开始着手数据可视化或沟通前,应该在理解上下文上多花时间和精力。

探索性分析和解释性分析

探索性分析是指理解数据并找出其中指的关注或分享给他人的精华。这就如同在牡蛎中寻找珍珠,可能打开一百个牡蛎,尝试上百种不同的假设或从上百种不同的角度审视数据后才碰巧找到两颗珍珠。在向受众进行分析时,我们迫切希望能够言之有物,例如解释某件事情或讲述某个故事。

人们往往在应该进行解释性分析(花时间将数据抽象为受众能够消化的信息)的时候错误地进行了探索性分析(简单地展示全部数据)。这种错误是可以理解的,在进行完整的分析后,向受众展示一切是非常诱人的,因为可以以此来证明你所做的工作及分析的可靠性。抑制住这种的冲动,因为那会让受众重复打开所有的牡蛎,把注意力集中在珍珠上,这才是你的受众需要了解的信息。

对象、内容、方式(Who、What、How)

在可视化数据或创建图标前必须思考并明确以下内容:
首先,你在跟谁沟通呢?深入了解你的受众是谁以及他们如何看待你是非常重要的。这可以帮助你发现你的受众的共识,从而确保他们能够听懂你的信息。
其次,你希望受众了解哪些内容或做什么呢?你应该明确你希望受众如何反应,并考虑你的沟通方式以及整体基调。
只要在你能简介地回答出以上两个问题后,才真正准备面对第三个问题:如何用数据表达自己的观点?

来看看对象、内容、方式的上下关联吧

你的受众

你的受众越具体,你就越能成功地进行沟通。避免“内部和外部的利益相关者”或“任何感兴趣的人”这样泛华的受众。细分受众的方式便是识别决策者,你对受众了解得越多,就越能准确理解如何与之产生共鸣,如何在沟通中满足双方的需求。

三分钟和中心思想

中心思想即将将沟通内容进一步精炼为一句话,中心思想包含三个部分:必须能陈诉你独特的关联,必须切中要害,必须是一个完整的具体。

2.让听众看懂图表

饼图是邪恶的,虽然3D图形拥有奇葩的视角并吸引眼球。但是人眼并不擅长于在二维空间进行定量的度量和计算,即时将3D饼图转化为2D,在很多情况下我们依然会很难分清百分比中谁大谁小。那么该怎么办呢?将饼图替换为水平条形图,就会变得一目了然。

数据可视化
邪恶的3D饼图.png

数据可视化
水平条形图.png

3. 精耕细作图表

杂乱你图表的敌人,在图表中消灭它。尽量识别出任何可能消耗受众精力的问题,每个元素都会增加听众的认知负荷,没必要的东西去掉会更加舒服。

数据可视化
原图.png
数据可视化
第一步.去掉边框.png

数据可视化
第二步.去掉网格.png

数据可视化
第三步.去掉数据标记.png

数据可视化
第四步.直接标记数据.png

数据可视化
第五步.保持颜色一致.png
数据可视化
前后对比.png

用数据讲故事

数据科学的本质是沟通,通过数据得到一些洞察,然后采用有效地方式将其传播给他人,并向其推销你的解决方案。

数据科学需围绕着你发现了什么,怎么发现的,这意味着什么,怎么发现的,意味着什么进行讲述的。

例如:你发现公司利润去年下降了35%,仅仅阐述这个事实是不够的,你必须说明为什么利润会下降,可以通过扫码方式来解决。

用数据将故事的要点如下:

  • 搞清楚并设置故事的上下文
  • 从多个角度进行探索
  • 有说服力的形象化展示
  • 使用多种数据源
  • 叙述的一致性

数据可视化之美

门捷列夫的元素周期表信息丰富,在此之前一直没有良好的可视化解决方案,基于种种原因,它被视为复杂数据可视化早起的一个杰作。

数据可视化
门捷列夫的元素周期表