机器学习之PCA降维理论推导

1. PCA降维后的超平面大概具有这样的性质

（1）最近重构性：样本点到这个超平面的距离的足够近

（2）最大可分性：样本点在这个超平面的投影尽可能分开

2. 依据最近重构性推导：

假定数据样本进行了中心化，再假设投影变换后得到的新坐标系为W =｛W1,W2,...,Wd｝，其中Wi是标准正交基向量, ||Wi||2 = 1, Wi.T*Wj = 0(i != j)。

若丢弃新坐标系中的部分坐标，即将维度降到d'<d。则样本点Xi在低维坐标系中的投影是Zi = (Zi1,Zi2,...,Zid')，其中Zij = Wj.T*Xi 是Xi在低维坐标系下第j维

的坐标。若基于Zi来重构Xi，则会得到Xi_hat = W*Zi。

设样本X.shape = (n,m)，空间向量W.shape = (n,d')，则Z = W.T*X, Z.shape = (d',m)。若基于Z来重构X,则X_hat = W*Z，X_hat.shape = (n,m)。

机器学习之PCA降维理论推导

其中λ是XXT的特征值，W是特征向量组成的矩阵。

3. 从最大可分性出发

机器学习之PCA降维理论推导