vis08-多变量数据可视化之属性云刷

原文链接

vis08-多变量数据可视化之属性云刷

公号:可视化论文阅读与英语学习

________________________________________________________________________________________

论文: Brushing of Attribute Clouds for the Visualization of Multivariate Data

作者: Heike Jänicke, Michael Böttinger, and Gerik Scheuermann

单位: Universität Leipzig 德国莱比锡大学

会议: Vis2008


一、多变量数据

对同一个自然现象,可能需要很多属性来描述.比如飓风数据,我们需要风速、降雨量、压强等多种属性对一次飓风现象进行描述.这种多属性属性通常称之为多变量数据.

二、多变量数据可视化现有方法

这篇论文将现有的多变量可视化分为两大类:

1.基于glyphs的方法

举例:starplots(图中每个轴代表一个变量,每个点由一个多边形构成,该多边形的每个节点都位于轴上,节点位置代表了该点在该变量上的属性值.)

vis08-多变量数据可视化之属性云刷

图片来源:An Animated Multivariate Visualization for Physiological and Clinical Data in the ICU

2.基于属性空间的可视化方法

举例:scatterplot与scatterplot matrix

vis08-多变量数据可视化之属性云刷

图一.scatterplot matrix.图片来源:The Many Faces of a Scafferplot

该文认为基于glyphs的方法更适合分析对某个具体点的值;基于属性空间的方法能够提供更高层次的抽象,能够应对更多的变量,能够检测变量间的关联性.因而本文延续第二类方式.

有意思的是,该文将平行坐标放在了第二类方法里.(笔者更倾向于认为平行坐标与starplots是强相关的)

三 多变量数据的转换

多变量数据转化的整体思路为将属性空间里的高维数据降维到二维空间.该文分为三步走:

欧几里德最小生成树 二维布局-属性云 离散化

  1. 欧几里德最小生成树(EMST)

生成树用线段链接属性空间内的所有点,生成图联通且无环,需要n-1个边链接n个点.如果联通点间的欧几里德距离最小,则生成树为欧几里德最小生成树(EMST).该文选用文献FINDING MINIMAL SPANNING TREES IN A EUCLIDEAN COORDINATE SPACE中方法,问题可以描述为:"给定k维欧几里德空间内的n点集合,用n-1个线段连接点,使得生成的图是联通的且线段长度的总和最小".算法一共包含三步:

  • 将属性空间里所有点存储在kd树中,存储的目的为在O(nlogn)时间里查找到距离任意一点的最近点.

  • 将每个点存储在一个单独的片段(fragment)中,并初始化(片段大小)队列.同大小片段随意插入.

  • 选择最小大小的片段,在一个片段以及非片段点间增加最短边.    

  • 重复上述操作直到仅剩下一个片段.EST树完成构建.

    该算法中间过程如图二所示,图二c中已经有七个大小为1的片段被连接到最近的非片段点上,蓝色圈出的点是下一个被处理的片段.最近点如图二d中所示,所有大小为1的片段连接之后结果图二e所示.


    图二.EST树生成示例

    2.二维布局-属性云

    在较高维度空间生成的EMST并不容易可视化出来,因此需要转为2D.以为属性空间为紧致的且在各个方向上非均匀,故PCA以及MDS方法不适用,本文采用保边长及少边交叉的力引导图布局方法进行投影.(此外涉及加边操作,可参考原文)

    3.离散化

    如果将属性空间内的所有点都包含在属性云内,难免导致遮挡记忆视觉混乱,因此本文将属性空间离散化,用一个代表点代表所有相同属性值子范围的点,代表点中点的总个数可以通过颜色映射以及点的尺度来显示.

讲过上述步骤之后,就生成了多变量数据的属性云.

四 基于属性云的可视化

讲过上述步骤之后,就生成了多变量数据的属性云.

  • 在属性云中整合信息

     为了在属性云中获取单点的不同属性值,该文采取颜色映射.如图三所示.

vis08-多变量数据可视化之属性云刷

图三.颜色映射点的某一属性值


  • 画刷

vis08-多变量数据可视化之属性云刷

图四.画刷界面:左:画刷区域,显示属性云以及附加信息;右:点的信息列;显示每个点的具体信息

  • 箱形图

   选择点之后通过箱形图展示统计信息,如图四所示.

五 结果

1.draft tube:

本文采用该数据展示了属性云与画刷相结合可以展示数据中的重要结构等基本功能.

并与scatterplot方法做对比.


vis08-多变量数据可视化之属性云刷

图五.左:属性云以及画刷;右:对应的数据显示结果

2.Delta Wing

本文首先对该数据绘制属性云,如图6上所示,可以利用画刷选取点,查看具体结构;也可以在属性云中增加空间位置属性;进行重新绘制属性云,进行进一步探索数据,如图六最下所示.


vis08-多变量数据可视化之属性云刷

图六 delta wing数据

其他结果略.

五 总结

本文思想可以考虑增加至时变体数据可视化中.降维,点集,流图相综合,是笔者最近的研究方向.