深度学习基本开发流程学习笔记

如图所示
1：准备数据就是生成左下方图，即100个数据点以Y=2X为基准分布在二维空间。
2：搭建模型就是正向传播和反向传播的过程
3：迭代训练就是重复多次正向传播和反向传播，一直到LOSS值很小。
4：使用模型就是把训练好模型的参数W和B重新加载来解决现实问题，如图中就是生成右下方的图。说白了就是测试模型是不是学到了Y=2X的数据分布规则。
深度学习基本开发流程学习笔记
其实给出的线性回归代码已经将这四步讲得很明确了，具体可以看注释，这里尤其要说明下这句代码：
train_Y = 2 * train_X + np.random.randn(100) * 0.3
我搞不明白为什么要加入噪声即np.random.randn(100) * 0.3，为什么呢？视频中说为了模拟更加真实的数据，为了防止过拟合，我不明白是什么意思？
带着这个问题，咨询老师，老师说有在真实的场景中，数据不可能是Y=2X，而是围绕这条线波动，比如股票的价格，而模型就是学到这种波动规则，这我就明白了。
如何验证是否学到这种规则：
plt.plot(train_X, sess.run(W) * train_X + sess.run(b), label=‘Fitted line’)而这句代码其实就是显示模型是否学到了波动的规则。

深度学习基本开发流程学习笔记

相关推荐