多维数据聚合、汇总和可视化是支撑数据分析领域的三大支柱。长久以来,高维数据可视化都是一个强有力的工具,被业界广泛使用,不只受限于 2 维。在本文中,作者将探索一些有效的多维数据可视化分析方法。
1、多维数据可视化之Andrews曲线
Andrews曲线将每个样本的属性值转化为傅里叶序列的系数来创建曲线。
通过将每一类曲线标成不同颜色,可以实现高维数据可视化聚类数据,属于相同类别的样本的曲线通常更加接近并构成了更大的结构。
2、多维数据可视化之平行坐标
平行坐标可以看到高维数据可视化中的类别,以及从视觉上估计其他的统计量。
使用平行坐标时,每个点用线段联接,每个垂直的线代表一个属性,一组联接的线段表示一个数据点。可能是一类的数据点会更加接近。
3、多维数据可视化之RadViz图
RadViz图是基于基本的弹簧压力最小化算法(在复杂网络分析中也会经常应用)。简单来说,将一组点放在一个平面上,每一个点代表一个属性。
4、多维数据可视化之因子分析
因子分析最初由心理学家斯皮尔曼发明,用于研究人类的人格特质。
著名的卡特尔16PF(16种相对独立的人格特征)就是应用因素分析方法得来。
是基于高斯潜在变量的一个简单线性模型,假设每一个观察值都是由低维的潜在变量加正态噪音构成。
5、多维数据可视化之主成分分析
主成分分析是由因子分析进化而来的一种降维的方法。
通过正交变换将原始特征转换为线性独立的特征,转换后得到的特征被称为主成分。主成分分析可以将原始维度降维到n个维度。
有一个特例情况,就是通过主成分分析将维度降低为2维,可以将高维数据可视化为平面中的点,来达到多维数据可视化的目的。
6、多维数据可视化之独立成分分析
独立成分分析将多源信号拆分成较大可能独立性的子成分,它最初不是用来降维,而是用于拆分重叠的信号。
7、多维数据可视化之多维尺度分析
多维尺度分析,试图寻找原始空间高维数据可视化的距离的良好低维表征。
简单来说,多维尺度分析被用于高维数据可视化分析相似性,它试图用几何空间中的距离来建模数据的相似性,即用二维空间中的距离来表示高维空间的关系。
高维数据可视化的,可以是物体之间的相似度、分子之间的交互频率或国家间交易指数,而且是基于欧式距离的距离矩阵。
看到以上几种多维数据可视化分析的结果是不是觉得很神奇,很显然在目前的信息时代,借助类似于FineBI的这些工具,可以让企业加速融入企业数据分析的趋势。备受市场认可的软件其实有很多,选择时必须要结合实际的情况。一般的情况下,都建议选择市面上较主流的产品,比较容易达到好的效果,目前企业数据分析BI软件市场占有率前列的,就是帆软bi软件——FineBI。
原创文章,作者:Maggie-Hunter,如若转载,请注明出处:https://blog.ytso.com/tech/bigdata/173725.html