【吴恩达课后测验】Course 3 - 结构化机器学习项目 - 第一周测验之关于我的理解

前10个很简单,对此没什么疑惑,第十一题我有一些迷,查阅网上资料后,清楚了一些,把我的理解挂上

 

【吴恩达课后测验】Course 3 - 结构化机器学习项目 - 第一周测验之关于我的理解 

 正则化是为了防止过拟合

开发集和测试集是属于同一分布的,此时两者的错误率相差很大,说明对开发集适应的太好,过拟合了,从而导致对测试集测试的不好。改善的策略有很多,为了防止过拟合,可以增加开发集大小等

【吴恩达课后测验】Course 3 - 结构化机器学习项目 - 第一周测验之关于我的理解 

 如果把数据放进数据集之后,训练的话就会造成对原有的图像进行再训练,这将会导致过拟合、新样本相对于总样本比例非常低、系统性能下降、时间过长等问题,所以把这1000张数据放进原有的数据集里面是不合理的。

【吴恩达课后测验】Course 3 - 结构化机器学习项目 - 第一周测验之关于我的理解 选项3中意思说的是你已经拥有了100,000,000个样本,但你只用10,000,000当总样本,如何分配Train/Dev/Test还没有说,只是这样你的训练就可以约在14/10=1.4天内完成而不需要两周

 

W = W - α * dW 缩小迭代次数有可能有效,但是会造成准确度不高的问题,在神经网络中,前面的层学习简单的特征,后面的层学习复杂的特征,缩小迭代次数可能会造成特征没有学习到,即使是在数据量充足的情况下,因为学习的迭代次数不高,所以可能会造成准确率不高的问题

 

个人理解,可能有不对地方,欢迎指正