深度学习-1简单的神经网络原理

理解简单的神经网络

深度学习最大的优点是特征工程（提取特征值）
神经网络就像一个黑盒子输入 x, 输出 f(x) 存在f(x）=wx+b的关系 x是权重矩阵 b是偏置矩阵分类或者回归任务时候根据标签 y 和预测值f(x) 的损失不断更新权重 w 和偏置b 当损失最小接近于0 时候用w b去部署应用

举例说明假如现在需要用神经网络做CIFAR-10 分类
cifar-10 图片是 32323 的图片分10类
1得分函数
f(x)=wx+b
w是10行 3072列的矩阵 b是一列10行的矩阵
样本有几类就有几列样本有多少特征值 w就有多少行
x 是 1列3072行的矩阵

f(x)是一列 10行的矩阵每列代表每个类别的得分

深度学习-1简单的神经网络原理
2计算损失函数
计算标签和f（x）的损失

为了防止过拟合加惩罚项

深度学习-1简单的神经网络原理
开始得出的是数值用softmax转换成概率

深度学习-1简单的神经网络原理
softmax 原理先把损失值通过f(x)=e^x 函数加大差距然后根据所有分类的打分归一化得出概率值
然后用log函数算出损失值
这个过程就是神经网络的前向传播