您的位置: 首页 > 文章 > [机器学习花书笔记] 主成分分析

[机器学习花书笔记] 主成分分析

分类: 文章 • 2024-07-09 21:01:46

问题：假设在 [机器学习花书笔记] 主成分分析空间中我们有 m 个点{}，我们希望对这些点进行有损压缩。

方法：

低维表示：

点 [机器学习花书笔记] 主成分分析 → 编码向量

若 [机器学习花书笔记] 主成分分析，则我们便使用了更少的内存来存储原来的数据。

to find [机器学习花书笔记] 主成分分析编码器

and [机器学习花书笔记] 主成分分析解码器

令 [机器学习花书笔记] 主成分分析，解码矩阵（简化解码器）

限制：D的列向量都有单位范数（为了获得唯一解）

限制：PCA 限制 D 的列向量彼此正交（简化解码器的最优编码问题）

解最优编码问题：

思路：最小化原始输入向量 x 和重构向量g(c)之间的距离。

[机器学习花书笔记] 主成分分析（使用L2范数）

推导：

[机器学习花书笔记] 主成分分析

[机器学习花书笔记] 主成分分析

[机器学习花书笔记] 主成分分析

（若A为单位正交矩阵，则 [机器学习花书笔记] 主成分分析）

[机器学习花书笔记] 主成分分析

则 [机器学习花书笔记] 主成分分析，。

挑选编码矩阵D：

回顾问题：最小化原始输入向量 x 和重构向量g(c)之间的距离。

[机器学习花书笔记] 主成分分析（使用L2范数）

此时可写作： [机器学习花书笔记] 主成分分析 .

为了推导用于寻求 [机器学习花书笔记] 主成分分析的算法，我们首先考虑 l = 1 的情况。

此时D是一个向量d，问题变成：

[机器学习花书笔记] 主成分分析

[机器学习花书笔记] 主成分分析（将标量写在左边）

或 [机器学习花书笔记] 主成分分析（标量的转置与自身相等）

将表示各点的向量按行堆叠成一个矩阵X，则问题又变成

[机器学习花书笔记] 主成分分析

[机器学习花书笔记] 主成分分析（参考迹的运算）

[机器学习花书笔记] 主成分分析

[机器学习花书笔记] 主成分分析

[机器学习花书笔记] 主成分分析

（迹运算性质： [机器学习花书笔记] 主成分分析）

问题变成：

[机器学习花书笔记] 主成分分析

[机器学习花书笔记] 主成分分析（根据约束条件化简）

[机器学习花书笔记] 主成分分析

这个优化问题可以通过特征分解来求解。具体来讲，最优的 d 是 [机器学习花书笔记] 主成分分析最大特征值对应的特征向量。

（原理见“特征分解”一节：

[机器学习花书笔记] 主成分分析）

以上推导特定于 l = 1 的情况，仅得到了第一个主成分。

更一般地，当我们希望得到主成分的基时，矩阵 D 由前 l 个最大的特征值对应的特征向量组成。

这个结论可以通过归纳法证明。

参考：机器学习花书