机器学习入门-3:范围

来源:https://www.cnblogs.com/subconscious/p/4107357.html
模式识别=机器学习
数据挖掘=机器学习+数据库
统计学习≈机器学习
语音识别=机器学习+语音处理
计算机视觉=机器学习+图像处理
自然语言处理=机器学习+文本处理

在这节对机器学习这些相关领域的介绍,有助于我们理清机器学习的应用场景和研究范围,更好地理解后面的算法和应用层次。
机器学习入门-3:范围
模式识别
模式识别=机器学习。模式识别是从工业界发展起来的,而机器学习来自计算机学科,可以被视为同一个领域的两个方面。

数据挖掘
数据挖掘=机器学习+数据库。近几年的数据挖掘,过于炒作。可能从数据中挖掘出金子,也可能挖出石头。数据挖掘仅仅是一种思考方式,告知我们应该尝试从数据中挖掘出知识,但不是每个数据都能挖出金子。一个拥有挖掘思维的人员才是关键,而且他还必须对数据有着深刻的认识,这样才能从数据中导出模式以改善业务。

统计学习
统计学习近似等于机器学习。统计学习是个与机器学习高度重叠的学科。因为机器学习中的大多数方法都来自统计学,甚至可以说,统计学的发展促进机器学习的繁荣昌盛。例如:支持向量机算法,就是源自统计学科。
两者的分别:统计学习重点关注的是统计模型的发展与优化,偏数学;机器学习更关注解决问题,偏实践。

计算机视觉
计算机视觉=图像处理+机器学习。图像处理技术用于将图像处理为适合进入机器学习模型的输入,机器学习则负责从图像中识别出相关的模式。百度识图、手写字符识别、车牌识别等都是计算机视觉的应用。随着机器学习的新领域深度学习的发展,大大促进计算机图像识别的效果,因此未来计算机视觉的发展前景不可估量。

语音识别
语音识别=语言处理+机器学习。语音识别技术一般不会单独使用,一般会结合自然语言处理的相关技术。目前的相关应用有苹果的语音助手siri等。

自然语言处理
自然语言处理=文本处理+机器学习。自然语言处理技术主要是让机器理解人类的语言的一门领域。在自然语言处理技术中,大量使用了编译原理相关的技术,例如此法分析、语法分析等。除此之外,在理解这个层面,则使用了语义理解、机器学习等技术。
百度机器学习专家于凯“听与看,是阿猫阿狗都会的,而只有语言才是人类独有的”。如何利用机器学习技术进行自然语言的深度理解,是工业和学术也关注的焦点。