机器学习面试必知：特征归一化

为了消除数据特征之间的量纲影响，我们需要对特征进行归一化处理，使得不同指标之间具有可比性。

线性归一化，对原数据进行线性变换，使得结果映射到[0,1]的范围。 $X_{norm}=\frac{X-X_{min}}{X_{max}-X_{min}}$

零均值归一化，将原数据映射到均值为0，标准差为1的分布上。假设原数据的均值为 $u$ ，标准差为 $\sigma$ ，那么 $z=\frac{x-u}{\sigma}$

从收敛来看，归一化后收敛得较快。在学习速率相同的情况下，归一化后所需要的迭代步数小于未归一化。