梯度下降：Backpropagation

文章目录

参考依据
Chain Rule
Backpropagation

Forward Pass
Backward Pass

case 1
case 2

总结

参考依据

李宏毅《深度学习》
https://www.bilibili.com/video/BV1JE411g7XF?p=13

Chain Rule

简单的链式法则，是反向传播唯一用到的数学基础：
梯度下降：Backpropagation

Backpropagation

要计算一个节点的梯度(损失函数对w求偏导：∂C/∂w)，可以利用chain rule将式子进行转换(∂C/∂w = ∂C/∂z * ∂z/∂w)：其中计算∂z/∂w的过程称之为Forward pass；而计算∂C/∂z的过程称之为Backward pass.
梯度下降：Backpropagation

Forward Pass

对取Forward Pass(∂z/∂w)这部分：求∂z/∂w其实就是看w前面连接的input是什么(线性函数，微分后为对应的x)，因此只要计算出网络里每个神经元的output(前一个的output就是后一个的input)，就可以知道任意的∂z/∂w。
梯度下降：Backpropagation
为什么叫Forward pass呢，因为需要计算出上一层神经的输出，才可以继续计算下一层的∂z/∂w，这是在数据流向前传递的过程中完成的。