理论上，一层隐藏层的神经网络就可以表示任意的函数，但是从效率、精度考量，在实际的神经网络构建中往往采用多个隐藏层（即深度学习）。本篇博客将介绍深度学习的优势。

相同神经元个数的深度学习

在神经元个数相同的情况下，多层神经网络的精度高于单层神经网络。
11、【李宏毅机器学习（2017）】Why Deep Learning? （为什么是深度学习？）

模组化

举个图像识别的例子，识别长发男生、长发女生、短发男生和短发女生，如下，由于长发男生样本少，所以模型训练出来的效果对测试集上的长发男生效果会比较差（样本不平衡）。
11、【李宏毅机器学习（2017）】Why Deep Learning? （为什么是深度学习？）

因此我们使用模组化的思想解决这一问题，我们先考虑识别基础类别（男女、长发短发），即我们先input一张图片，识别这是长发还是短发，这是男还是女，此时样本比例是相当的，由此训练的效果不会变差，且由两个基础类别的组合可以得到最终的四个类别。
11、【李宏毅机器学习（2017）】Why Deep Learning? （为什么是深度学习？）

深度学习的优势就体现在模组化的处理方式，第二层的神经元把第一层的神经元当作modile，第三层的神经元把第二层的神经元当作module（具体module由算法自动学习）。此时复杂的问题变成简单问题，深度学习需要的数据比较少。
11、【李宏毅机器学习（2017）】Why Deep Learning? （为什么是深度学习？）

模组化的应用

图像识别

11、【李宏毅机器学习（2017）】Why Deep Learning? （为什么是深度学习？）

语音识别

人类语言的架构：比如一句 what do you think，这一句话其实是有phoneme（音素）组成，同样的phoneme可能会有不一样的发音（比如d uw和y uw中，由于前一个音素不同，所以导致口腔真正发出的两个uw不一样），因此我们给同样的phoneme不同的model（Tri-phone，该音素加上前后两个音素）。语音识别简而言之：从声音信号输出声音的特性（state），再从state转乘phoneme，phoneme转成文字。

11、【李宏毅机器学习（2017）】Why Deep Learning? （为什么是深度学习？）

11、【李宏毅机器学习（2017）】Why Deep Learning? （为什么是深度学习？）

相同神经元个数的深度学习

模组化

模组化的应用

图像识别

语音识别

相关推荐