Week2 总结 例子
Error Analysis
Carrying out error analysis 找出分类结果中出错最多的情况,并减少错误,以提高整体精确率 猫识别中,将猫错识别成狮子等的概率为43%。
Cleaning up incorrectly labeled data 当出现标签错误时,考虑标签错误所带来的影响,决定是否要修正错误标签。训练集标签错误一般不需要修改。 标签错误率为6%。实际上有一些错误不是神经网络的输出错误,而是标签错误。
Build your first system quickly, then iterate Build your first system quickly, then iterate Speech recognition
Face recognition
Mismatched training and dev/test set
Training and testing on different distributions 当训练集、dev集和测试集来自不同的数据来源时,dev集和测试集使用系统真正要判断的数据。 200000张网页图片和10000张手机图片,未来要识别的是用户手机的图片,故dev集和测试集都使用这10000张图片。具体分配:205000训练集(其中200000来自网页图片,5000来自手机图片)、2500张dev集、2500张测试集。
Smart mirror
Bias and Variance with mismatched data distributions 当训练集、dev集、测试集来自不同数据来源时,若训练集和dev集精确率相差较大,可拆分训练集为training和training-dev集,从而判断variance是由于过拟合training集还是由于两个数据集的来源不同(data mismatch)造成的
bias; variance; data mismatch
Smart mirror
Addressing data mismatch Carry out manual error analysis to try to understand difference between training and dev/test sets Speech recognition system
Make training data more similar; or collect more data similar to dev/test sets Car recognition
Artificial data synthesis
Speech recognition system
Car recognition
Learning from multiple tasks
Transfer learning 去掉已经训练好的神经网络的最后一层及其权值,增加新的输出层,再使用新的数据训练神经网络。若数据较多,训练神经网络时可调整整个神经网络的w和b;若数据较少,可以仅调整最后一层,或后两层的w和b。 Transfer learning适用于:from的数据很多,to的数据很少 Image recognition -> radiology diagnose
Speech recognition -> trigger
Multi-task learning 输出层的神经元不止一个,使用一个大的神经网络来解决多任务学习,而不是使用几个小系统来分别实现单个任务 交通系统:车识别、信号灯识别、路标识别、行人识别
End-to-end deep learning
What is end-to-end deep learning 把许多大问题拆分成几个步骤来实现会使问题变得简单,且可以有更多的数据 人脸识别系统:定位人脸->识别
Whether to use end-to-end deep learning Key question: Do you have sufficient data to learn a function of the complexity needed to map x to y? 人脸识别系统

