主成分分析(PCA)

数据降维的作用
降维是将高维度的数据(指标太多)保留下最重要的一些
特征,去除噪声和不重要的特征,从而实现提升数据处理速度
的目的。
在实际的生产和应用中,降维在一定的信息损失范围内,
可以为我们节省大量的时间和成本。降维也成为应用非常广泛
的数据预处理方法。
主成分分析便是一种降维算法

主成分分析的思想

主成分分析(PCA)主成分分析(PCA)

计算步骤

主成分分析(PCA)1、首先我们将其变准化处理
主成分分析(PCA)2、计算标准样本的协方差矩阵
主成分分析(PCA)3、计算R的特征值和特征向量
主成分分析(PCA)
4、计算主成分及累计贡献率
主成分分析(PCA)5、写出主成分
主成分分析(PCA)
6、根据系数分析主成分代表的意义
对于某个主成分而言,指标前面的系数越大,代表该指标对于该主成分的影响越大

7、利用主成分的结果进行后续分析
可用于聚类分析(方便画图)、回归分析等。千万不能用于评价类模型!!!

参考资料:清风《数学建模学习交流》