动量梯度下降法: Gradient Descent With Momentum

动量梯度下降法:  Gradient  Descent With  Momentum

1.指数加权移动平均:

动量梯度下降法: Gradient Descent With Momentum

 

2.指数加权平均的偏差修正:

动量梯度下降法: Gradient Descent With Momentum

如图所示:紫色图为这些点集的加权平均,但很显然在刚开始的时候,加权平均不能很好估测数据。所以我们需要通过偏差修正加权平均。

动量梯度下降法: Gradient Descent With Momentum

3.动量梯度下降法:  

动量梯度下降法: Gradient Descent With Momentum

 当我们使用梯度下降算法进行训练的时候,我们的训练过程会出现左图所示, 慢慢摆动到最小值,这种上下波动减慢了梯度下降法的速度,你就无法使用更大的学习 率,如果你要用较大的学习率(紫色箭头),结果可能会偏离函数的范围如图右图所示,为了避免摆动过 大,你要用一个较小的学习率。

5.动量梯度下降法公式:

动量梯度下降法: Gradient Descent With Momentum动量梯度下降法: Gradient Descent With Momentum

6.由指数加权移动平均理解动量法

动量梯度下降法: Gradient Descent With Momentum