【吴恩达课后测验】Course 3 - 结构化机器学习项目 - 第一周测验之关于我的理解

前10个很简单，对此没什么疑惑，第十一题我有一些迷，查阅网上资料后，清楚了一些，把我的理解挂上

正则化是为了防止过拟合

开发集和测试集是属于同一分布的，此时两者的错误率相差很大，说明对开发集适应的太好，过拟合了，从而导致对测试集测试的不好。改善的策略有很多，为了防止过拟合，可以增加开发集大小等

【吴恩达课后测验】Course 3 - 结构化机器学习项目 - 第一周测验之关于我的理解

如果把数据放进数据集之后，训练的话就会造成对原有的图像进行再训练，这将会导致过拟合、新样本相对于总样本比例非常低、系统性能下降、时间过长等问题，所以把这1000张数据放进原有的数据集里面是不合理的。

【吴恩达课后测验】Course 3 - 结构化机器学习项目 - 第一周测验之关于我的理解选项3中意思说的是你已经拥有了100，000，000个样本，但你只用10，000，000当总样本，如何分配Train/Dev/Test还没有说，只是这样你的训练就可以约在14/10=1.4天内完成而不需要两周

W = W - α * dW 缩小迭代次数有可能有效，但是会造成准确度不高的问题，在神经网络中，前面的层学习简单的特征，后面的层学习复杂的特征，缩小迭代次数可能会造成特征没有学习到，即使是在数据量充足的情况下，因为学习的迭代次数不高，所以可能会造成准确率不高的问题

个人理解，可能有不对地方，欢迎指正