平行坐标是可视化高维几何和分析多元数据的常用方法。
为了在n维空间中显示一组点,绘制由n条平行线组成的背景,通常是垂直且等距的。所述的点N 维空间被表示为折线与顶点在平行的轴线; 第i 轴上顶点的位置对应于该点的第i个坐标。
此可视化与时间序列可视化密切相关,除了它应用于轴与时间点不对应的数据,因此没有自然顺序。因此,不同的轴布置可能是有意义的。
平行坐标详解为了表示在高维空间的一个点集, 在N条平行的线的背景下,(一般这N条线都竖直且等距),一个在高维空间的点被表示为一条拐点在N条平行坐标轴的折线,在第K个坐标轴上的位置就表示这个点在第K个维的值。1
平行坐标是信息可视化的一种重要技术。为了克服传统的笛卡尔直角坐标系容易耗尽空间、 难以表达三维以上数据的问题, 平行坐标将高维数据的各个变量用一系列相互平行的坐标轴表示, 变量值对应轴上位置。 为了反映变化趋势和各个变量间相互关系,往往将描述不同变量的各点连接成折线。所以平行坐标图的实质是将 维欧式空间的一个点Xi(xi1,xi2,...,xim) 映射到维平面上的一条曲线。
平行坐标图可以表示超高维数据。 平行坐标的一个显著优点是其具有良好的数学基础, 其射影几何解释和对偶特性使它很适合用于可视化数据分析。
历史平行坐标通常被认为是由Philbert Maurice在1885年发明的但即使在书名中出现了“Coordonnéesparallèles”这个词,但这项工作与相同的可视化技术无关名称;这本书只描述了一种坐标变换的方法。但是即使在1885年之前,也使用了平行坐标,例如在亨利甘尼茨的“总摘要,显示国家等级,按比率,1880年”,或之后在亨利甘尼茨“人口在每次人口普查中的排名,1790-1890“。他们在79年后再次被Alfred Inselberg推广,在1959年,系统开发从1977年开始一些重要的应用是在一个坐标系防撞算法用于空中交通管制(1987-3美国专利),数据挖掘(美国专利),优化,过程控制,最近在入侵检测和其他地方。
更高的尺寸在具有xy笛卡尔坐标系的平面上,在平行坐标中添加更多尺寸涉及添加更多的坐标轴。2平行坐标的值是高维中的某些几何特性转化为容易看到的2D图案。例如,在一列的一组点的Ñ-space转变为一组的多段线在平行坐标在所有交叉n- 1分。对于n= 2,这产生了一个点线二元性,指出为什么平行坐标的数学基础是在投影而不是欧氏理论中发展起来的空间。一对线相交于具有两个坐标的唯一点,因此可以对应于也由两个参数(或两个点)指定的唯一线。相比之下,指定曲线需要两个以上的点,并且一对曲线可能没有唯一的交点。因此,通过使用平行坐标而不是线的曲线,点线对偶性与投影几何的所有其他性质一起丢失,并且已知的与(超)平面,曲线,几个平滑(超)表面对应的更好的高维图案,近似度,凸度和最近的不可定向性。目标是将n维关系映射为2D模式。因此,平行坐标不是点对点映射,而是nD子集到2D子集映射,信息不会丢失。注意:即使是nD中的一个点也不会映射到2D中的一个点上,而是映射到一个折线2D的一个子集。
统计考虑当用于统计数据可视化时,有三个重要的考虑因素:轴的顺序,旋转和缩放。
轴的顺序对于查找特征至关重要,并且在典型的数据分析中,需要尝试许多重新排序。一些作者提出了订购启发式方法,这可能会产生照明顺序。
轴的旋转是平行坐标中的平移,并且如果线在平行轴之外相交,则它们可以通过旋转在它们之间平移。最简单的例子就是将轴旋转180度。
缩放是必要的,因为该图基于连续变量对的插值(线性组合)。因此,变量必须具有共同的规模,并且有许多缩放方法可以作为数据准备过程的一部分来考虑,这可以揭示更多信息量的视图。
样条曲线可以实现平滑的平行坐标图。在平滑图中,每个观测值都被映射到参数线(或曲线),该参数线在光轴上是平滑的,连续的并且与每个平行轴正交。这种设计强调每个数据属性的量化级别。如果使用度数的傅里叶插值等于数据维数,则可以得到安德鲁斯曲线。
本词条内容贡献者为:
刘军 - 副研究员 - 中国科学院工程热物理研究所