为什么说深度学习和机器学习截然不同? 【分分钟搞定】 人工智能 - 机器学习 - 深度学习 三者之间的关系

关于AI报道的狂轰乱炸,动不动就各种智能,其实很多人对于 人工智能AI - 机器学习ML - 深度学习DL 三者之间的关系并没有弄清楚,这里做个简单介绍。

为什么说深度学习和机器学习截然不同? 【分分钟搞定】 人工智能 - 机器学习 - 深度学习 三者之间的关系

如上图所示,简单明了的展示了:人工智能是个大的范畴,机器学习实现人工智能的一种手段,而深度学习是机器学习里面的其中一个方法。人工智能的概念早在1950年就被提出来了,只是人类一直没有找一个可行的手段去实现这个美好的愿望。直到1980年机器学习的出现,才初步找到了一个可以看到希望的道路,但是一路走来,这条路非常坎坷荆棘丛生。再到2010年深度学习的出现,现在正是火热,很多人都在往这条路赶,看起来前景还不错,但路途漫漫,何人知晓未来。

简单说一下三者的概念。

机器学习:任何通过数据训练的学习算法的相关研究都属于机器学习,包括很多已经发展N年的技术,比如:线性回归(Linear Regression)、K均值(K-means,基于原型的目标函数聚类方法)、决策树(Decision Trees,运用概率分析的一种图解法)、随机森林(Random Forest,运用概率分析的一种图解法)、PCA(Principal Component Analysis,主成分分析)、SVM(Support Vector Machine,支持向量机)以及ANN(Artificial Neural Networks,人工神经网络)。所以可以看出,人工神经网络只是实现机器学习的与其他方法并列一个方法而已,并不是全部。想做机器学习不一定非要用神经网络。

而人工神经网络则是深度学习的起源。

深度学习:是实现机器学习的一种技术。早期机器学习研究者中还开发了一种叫人工神经网络的算法,但是发明之后数十年都默默无闻。神经网络是受人类大脑的启发而来的:神经元之间的相互连接关系。但是,人类大脑中的神经元可以与特定范围内的任意神经元连接,而人工神经网络中数据传播要经历不同的层,传播方向也不同。

举个例子,你可以将一张图片切分为小块,然后输入到神经网络的第一层中。在第一层中做初步计算,然后神经元将数据传至第二层。由第二层神经元执行任务,依次类推,直到最后一层,然后输出最终的结果。

每个神经元都会给其输入指定一个权重:相对于执行的任务该神经元的正确和错误程度。最终的输出由这些权重共同决定。因此,我们再来看看上面提到的停止标志示例。一张停止标志图像的属性,被一一细分,然后被神经元“检查”:形状、颜色、字符、标志大小和是否运动。神经网络的任务是判断这是否是一个停止标志。它将给出一个“概率向量”(probability vector),这其实是基于权重做出的猜测结果。在本文的示例中,系统可能会有 86% 的把握认定图像是一个停止标志,7% 的把握认为是一个限速标志,等等。网络架构然后会告知神经网络其判断是否正确。 
不过,问题在于即使是最基础的神经网络也要耗费巨大的计算资源,因此当时不算是一个可行的方法。不过,以多伦多大学 Geoffrey Hinton 教授为首的一小批*研究者们坚持采用这种方法,最终让超级计算机能够并行执行该算法,并证明该算法的作用。如果我们回到停止标志那个例子,很有可能神经网络受训练的影响,会经常给出错误的答案。这说明还需要不断的训练。它需要成千上万张图片,甚至数百万张图片来训练,直到神经元输入的权重调整到非常精确,几乎每次都能够给出正确答案。不过值得庆幸的是Facebook 利用神经网络记住了你母亲的面孔;吴恩达 2012 年在谷歌实现了可以识别猫的神经网络。

 

有一些人觉得深度学习不过就是多层结构的人工神经网络而已,此外,认为深度学习成功的主要原因是大量可用的数据以及像GPU这样更强大的计算引擎的出现。这当然是事实,深度学习的出现基本要归因于这两方面的进展。但是,如果就此下结论说深度学习不过是比支持向量机或者决策树更好的算法而已,那就真的是一叶障目,不见泰山了。如果说“软件正在占领全世界”,那么深度学习就正在取代机器学习。两篇来自不同机器学习领域的从业者很好的解释了为什么深度学习正在占领全世界

神经语言程序学(NLP)的专家Chris Manning这样形容“深度学习海啸”:深度学习的浪潮在几年前就已经抵达计算语言学的海岸,但是2015似乎是这场海啸全面冲击各大自然语言处理(NLP)会议的一年。一些专家预言,最终的冲击将会更大

Nicholas Paragios则写了一篇名为“计算机视觉研究:大萧条”的文章,以下是文章节选:在高度复杂以及很大程度由图片的*度决定的问题上,深度学习一旦被赋予大量被标记的数据以及不可想象(直到最近)的计算能力,就能解决所有的计算机视觉问题。如果是这样的话,那么深度学习占领业界,计算机视觉研究成为边缘学科并走上计算机图形的老路(学术研究的活跃度和数量)将只是时间问题。

这两篇文章都强调了深度学习相对机器学习是有颠覆性的意义的。当然,深度学习在商用领域也具备同样的颠覆性。但是让人震惊和困惑的是,就连Gartner也没能分清机器学习和深度学习之间的差别。这里是Gartner于2016年8月份发布的发展规律周期图(Hyper Cycle),深度学习甚至没有被提及:

为什么说深度学习和机器学习截然不同? 【分分钟搞定】 人工智能 - 机器学习 - 深度学习 三者之间的关系

尽管被Gartner忽视了深度学习,而深度学习依然持续火热。目前对深度学习的炒作主要是:我们已经拥有了可以商用的机器,只要给它们足够多的数据和足够长的时间,它们就能够自己学习。要么是夸大了深度学习的现有技术水平,要么就是将深度学习的实践过于简化了。在过去的几年里,深度学习产生了大量的想法和技术,这些在以前要么是未知的,要么是站不住脚的。起初,这些概念是碎片化而且毫无关联的,但是随着时间的推移,大量的模式和方法开始涌现,深度学习设计模式这一领域也变得热闹起来。

深度学习在现在不仅仅是具备多层架构的感知器,而是一系列能够用来构建可组合可微分的体系结构的技术和方法。这些具有超强能力的机器学习系统只不过是我们目前所能看到的冰山一角。关键在于,虽然深度学习目前看起来像点金术,但是总有一天我们会学会如何像操控化学一样操控它。有了这个基础,我们将能够更好的预测机器学习未来所能具备的能力。

 

参考:http://www.leiphone.com/news/201612/ivLxiAXyHTCqGu0K.html

          *大学李宏毅、斯坦福大学吴恩达等