多元梯度下降法演练(1)--特征缩放(特征归一化),Feature Scaling,mean normalization machine learning

1.目的

将特征值归一化的目的是让代价函数收敛的速度变快。

2.怎么做

2.1 Feature Scaling(特征归一化)

2.1.1 公式

公式为:xia=xibximaxx_{ia}=\frac{x_{ib}}{x_{imax}}我们希望将xix_i的范围控制在1xi1-1\leq x_i \leq 1

2.1.2 举例:

假设x1x_1的取值范围是(0,2000)x2x_2的取值范围为{0,1,2,3,4,5},因为x1x2x_1,x_2取值范围的巨大差距,导致等值线为
​​​​​​​​​​多元梯度下降法演练(1)--特征缩放(特征归一化),Feature Scaling,mean normalization machine learning
可以看见其梯度下降是曲曲折折,路径走的很长。
如果我们将其归一化,即
x1=x12000,x2=x25x_1=\frac{x_1}{2000},x_2=\frac{x_2}{5}
那么其等值线为
多元梯度下降法演练(1)--特征缩放(特征归一化),Feature Scaling,mean normalization machine learning
收敛速度很快。

2.1.3 注意

并不需要完全严格的将其幅度控制在±1\pm 1之间,吴恩达教授给我们给出的是大的范围是3xi3-3 \leq x_i \leq 3
小的范围是13xi13-\frac{1}{3} \leq x_i \leq \frac{1}{3}

2.2 mean normalization(均值归一化)

2.2.1公式

公式为:xi=xiμiximaxximinx_i=\frac{x_i-\mu_i}{x_{imax}-x_{imin}}其中,μi\mu_ixix_i的均值。
范围是0.5xi0.5-0.5 \leq x_i \leq 0.5