11、【李宏毅机器学习(2017)】Why Deep Learning? (为什么是深度学习?)

理论上,一层隐藏层的神经网络就可以表示任意的函数,但是从效率、精度考量,在实际的神经网络构建中往往采用多个隐藏层(即深度学习)。本篇博客将介绍深度学习的优势。


目录


相同神经元个数的深度学习

在神经元个数相同的情况下,多层神经网络的精度高于单层神经网络。
11、【李宏毅机器学习(2017)】Why Deep Learning? (为什么是深度学习?)

模组化

举个图像识别的例子,识别长发男生、长发女生、短发男生和短发女生,如下,由于长发男生样本少,所以模型训练出来的效果对测试集上的长发男生效果会比较差(样本不平衡)。
11、【李宏毅机器学习(2017)】Why Deep Learning? (为什么是深度学习?)

因此我们使用模组化的思想解决这一问题,我们先考虑识别基础类别(男女、长发短发),即我们先input一张图片,识别这是长发还是短发,这是男还是女,此时样本比例是相当的,由此训练的效果不会变差,且由两个基础类别的组合可以得到最终的四个类别。
11、【李宏毅机器学习(2017)】Why Deep Learning? (为什么是深度学习?)

深度学习的优势就体现在模组化的处理方式,第二层的神经元把第一层的神经元当作modile,第三层的神经元把第二层的神经元当作module(具体module由算法自动学习)。此时复杂的问题变成简单问题,深度学习需要的数据比较少
11、【李宏毅机器学习(2017)】Why Deep Learning? (为什么是深度学习?)

模组化的应用

图像识别

11、【李宏毅机器学习(2017)】Why Deep Learning? (为什么是深度学习?)

语音识别

人类语言的架构:比如一句 what do you think,这一句话其实是有phoneme(音素)组成,同样的phoneme可能会有不一样的发音(比如d uw和y uw中,由于前一个音素不同,所以导致口腔真正发出的两个uw不一样),因此我们给同样的phoneme不同的model(Tri-phone,该音素加上前后两个音素)。语音识别简而言之:从声音信号输出声音的特性(state),再从state转乘phoneme,phoneme转成文字。

11、【李宏毅机器学习(2017)】Why Deep Learning? (为什么是深度学习?)
11、【李宏毅机器学习(2017)】Why Deep Learning? (为什么是深度学习?)