数据可视化——向木东居士学习 第二期
【数据科学家学习小组】之数据可视化(第二期)第二周 学习总结
本系列文章主要目的有两个:
- 从数据可视化的角度出发,总结一下现在无论是数据可视化还是报表开发、BI开发的工具和思路
- 从木东居士的学习小组学习到一些大厂的工作学习思路,让自己思考的更全面更成熟,完成的文档也更加全面、漂亮。
学习内容
「时序数据」和「比例数据」的可视化
- 了解时序数据的特点,熟练掌握不同类型的时序数据分别适合的图表类型;
- 了解比例型数据可视化的目的,学会根据数据集的特征去选择合适的图表;
- 实践:从给定的4个数据集中挑选两个,自行选择合适图表并进行可视化呈现
知识总结
时序数据:
- 离散时间点(少周期):柱状图、并列柱状图、堆叠柱状图、百分比堆叠柱状图等
- 重点突出:数据构成不要太多
- 分类占比变化:使用百分比堆叠柱状图
- 对比明显:数据条数不要太多
- 连续时间点(多周期):折线图、面积图、堆叠面积图、瀑布图(阶梯图)、拟合曲线图等
- 点线图:数据项不超过12个
- 折线图:当数据集中的数据项比较多,大于12条时,采用点线图,会让整条线上的点很密集,影响看数据的趋势,此时采用折线图是不错的选择
- 曲线图:相邻节点的连线更加平滑,更能体现趋势变化
- 阶梯图:某两个相邻的时间节点,后一个节点的数据相对于前一个节点数据的升降变化,常用于商品价格变动、股票价格波动、税率变化等场景中。
- 前一时间节点数值;
- 当前时间节点数值;
- 当前节点较前一节点的差值;
比例数据:
-
不含时间属性:饼图、环形图、嵌套的饼图、矩形树图;
-
饼图
当构成整体的数据项较少时,采用饼图是一种不错的选择。建议扇区个数最大值在5~7个之间。当数据项超过一定数量时,可以按照占比,把排名最末的几项归位「其他」
-
环形图
饼图通过各扇区角度去映射各分类项对应的数值,「环形图」则通过各弧形的长度来衡量数值。
-
矩形树图
矩形树图,是一种基于面积的可视化方法。外部矩形代表父级类别,内部矩形代表子类别。相比于其他表示比例型的数据,矩形树图更适合展示具有树状结构的数据。
-
-
含时间属性:百分比堆叠柱状图、百分比堆叠面积图;
完成作业
- 场景1:某电商公司2018年销售额趋势
场景1提供的数据是一个汇总数据,从数据粒度的角度看来,每行数据所表达的信息并不明确,所以需要预先做好数据处理工作,将每行数据变成月度销售额数据,度量是销售额,维度是商品分类。
最终使用堆叠柱状图表示了销售额总值的变化,用颜色区分了不同的商品分类(每月的总值趋势线没有成功添加上)
- 场景2:某只股票在2019年10月份的价格变动
这个数据直接使用阶梯图(瀑布图或蜡烛图),注意使用tableau中的颜色和大小选项来控制图形的颜色和柱大小
- 场景3:某快递公司每天寄件单的揽收时效分布
直接使用矩形树图
- 场景4:主流快递公司承运量流向分布
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZiKe7nSo-1574322902977)(C:\Users\Brown\AppData\Roaming\Typora\typora-user-images\1574321375400.png)]
场景4比较复杂,严格意义上说需要用两个图,但是如果只要数量不看占比的话一个图也是可以做到的
作图之前也是进行了一些数据处理工作
最终使用tableau制作的看板如下
参考文章
- 如何优雅地选择数据图表:时序数据和比例型数据!
- 《鲜活的数据》 第4章p73和第5章p111
- 【数据科学家学习小组】之数据可视化(第一期)第二周