李宏毅深度学习笔记(七)初探深度学习

李宏毅深度学习笔记(七)初探深度学习

Neural Network

如图所示,下图前端的1和-1为输入层,y1y_1y2y_2为输出层,中间的蓝色圆圈、红色圆圈和绿色圆圈为隐藏层。以输入层到第一层隐藏层的计算为例,如果第一层隐藏层的函数为Sigmoid函数,则当以第一层隐藏层作为输入时输入向量的计算如下:
李宏毅深度学习笔记(七)初探深度学习
推广到一般情况:
李宏毅深度学习笔记(七)初探深度学习
在做多分类时通常会在输出层加上一个Softmax:
李宏毅深度学习笔记(七)初探深度学习
举一个数字识别的例子:
李宏毅深度学习笔记(七)初探深度学习李宏毅深度学习笔记(七)初探深度学习
在这样的多层神经网络里面已经限定了输入的维数和输出的维数,我们所需要做的就是设计隐藏层的层数和每一层神经元的个数还有每一层的函数。

Goodness of function

先拿一个训练样本来举例:
李宏毅深度学习笔记(七)初探深度学习
Cross Entropy.这里用了交叉熵损失函数来衡量模型的好坏。
当然真正的训练集肯定不止一个样本:
李宏毅深度学习笔记(七)初探深度学习
这时我们就要用整个的损失函数了,对损失函数进行求解找到使损失函数最小化的参数θ\theta^*
最后用梯度下降的方法来求参数θ\theta^*即可。