您的位置: 首页 > 文章 > 深度学习_准备工作

深度学习_准备工作

分类: 文章 • 2024-05-16 22:40:28

深度学习

常用函数
学习率问题
反向传播：
神经网络可以表达非线性的原因
参数初始化

常用函数

sigmoid：
深度学习_准备工作
Relu**函数
sigmoid存在的主要缺点是当网络层数较多的时候容易发生梯度消失因为在sigmoid中 x值过大或者过小它的倒数值都会接近于0 ，这样便不能进行反向传播。而Relu函数不会

Softmax：

学习率问题

学习率过高过或过低都不行

深度学习_准备工作

反向传播：

反向传播即在 更新w的时候需要做的事情 一步一步的反向求导 更新参数

深度学习_准备工作

神经网络可以表达非线性的原因

由于有了**函数可以使得线性的WX经过**函数后表达出非线性效果
深度学习_准备工作

参数初始化

对于w若开始是0 则参数无法更新一般采用随机初始化 w在0-1之间对于B的初始化是取0或者1
深度学习_准备工作