1.PCA最小平方误差理论

问题1：PCA求解的其实是最佳投影方向，既一条直线，这与数学中线性回归问题的目标不谋而合，能否从回归的角度定义PCA的目标并相应的求解问题呢？

答：我们还是从二维空间考虑，上一节求解得到一条直线使得样本点投影到该直线上方差最大，从求解直线的思路出发，很容易联想到线性回归，那么从线性回归出发，去定义PCA的目标，就是在高维空间中，找到一个d维的超平面，使得数据点到这个超平面的距离平方最小。

数据集中每个数据点到d维超平面D的距离为《百面》-4.降维（PCA专场）-2 ,其中表示在超平面D上的投影向量，如果该超平面有d个标准正交基W={w1,w2,......wd}构成，所以,

注释：

标准是指每个向量的长度为单位长 1 ,
正交是指每两个向量都垂直,
基是指一组向量,用它们可以表示空间中所有向量.
在 n 维空间中,标准正交基就是指这样 n 个向量：a1=(1,0,0,.,0）,
a2=(0,1,0,0,.,0）,a3=(0,0,1,0,.,0）,.
an=(0,0,0,.,0,1） .
如果向量 p 可以表示成 p=x1*a1+x2*a2+.+xn*an ,
那么（x1,x2,x3,.,xn）就叫向量 p 在基｛a1,a2,.,an｝下的坐标.
坐标与线性运算的关系是：
1、和向量的坐标等于向量坐标的和；
2、差向量的坐标等于向量坐标的差；
3、数乘向量的坐标等于这个数乘以向量的坐标.

举个例子 w1={1,0,0,0}^T x1的映射就是w^T*x1 那么为啥后面有多乘以个w，是为了把行向量变成列向量。（毛病）

所以《百面》-4.降维（PCA专场）-2