机器学习面试必知:特征归一化
为了消除数据特征之间的量纲影响,我们需要对特征进行归一化处理,使得不同指标之间具有可比性。
线性归一化,对原数据进行线性变换,使得结果映射到[0,1]的范围。
零均值归一化,将原数据映射到均值为0,标准差为1的分布上。假设原数据的均值为,标准差为,那么
从收敛来看,归一化后收敛得较快。在学习速率相同的情况下,归一化后所需要的迭代步数小于未归一化。
为了消除数据特征之间的量纲影响,我们需要对特征进行归一化处理,使得不同指标之间具有可比性。
线性归一化,对原数据进行线性变换,使得结果映射到[0,1]的范围。
零均值归一化,将原数据映射到均值为0,标准差为1的分布上。假设原数据的均值为,标准差为,那么
从收敛来看,归一化后收敛得较快。在学习速率相同的情况下,归一化后所需要的迭代步数小于未归一化。