主成分分析(PCA)
数据降维的作用
降维是将高维度的数据(指标太多)保留下最重要的一些
特征,去除噪声和不重要的特征,从而实现提升数据处理速度
的目的。
在实际的生产和应用中,降维在一定的信息损失范围内,
可以为我们节省大量的时间和成本。降维也成为应用非常广泛
的数据预处理方法。
主成分分析便是一种降维算法
主成分分析的思想
计算步骤
1、首先我们将其变准化处理
2、计算标准样本的协方差矩阵
3、计算R的特征值和特征向量
4、计算主成分及累计贡献率
5、写出主成分
6、根据系数分析主成分代表的意义
对于某个主成分而言,指标前面的系数越大,代表该指标对于该主成分的影响越大
7、利用主成分的结果进行后续分析
可用于聚类分析(方便画图)、回归分析等。千万不能用于评价类模型!!!
参考资料:清风《数学建模学习交流》