机器学习--多标签softmax + cross-entropy交叉熵损失函数详解及反向传播中的梯度求导

https://blog.****.net/oBrightLamp/article/details/84069835

正文
在大多数教程中, softmax 和 cross-entropy 总是一起出现, 求梯度的时候也是一起考虑.
softmax 和 cross-entropy 的梯度, 已经在上面的两篇文章中分别给出.

1 题目
考虑一个输入向量 x, 经 softmax 函数归一化处理后得到向量 s 作为预测的概率分布, 已知向量 y 为真实的概率分布, 由 cross-entropy 函数计算得出误差值 error (标量 e ), 求 e 关于 x 的梯度.
机器学习--多标签softmax + cross-entropy交叉熵损失函数详解及反向传播中的梯度求导

机器学习--多标签softmax + cross-entropy交叉熵损失函数详解及反向传播中的梯度求导
机器学习--多标签softmax + cross-entropy交叉熵损失函数详解及反向传播中的梯度求导
机器学习--多标签softmax + cross-entropy交叉熵损失函数详解及反向传播中的梯度求导
机器学习--多标签softmax + cross-entropy交叉熵损失函数详解及反向传播中的梯度求导

11