浅谈机器学习与深度学习

1 人工智能、机器学习与深度学习的联系

20世纪90年代以来,随着大数据和计算机硬件的快速发展,人工智能技术再一次迎来了全新的发展,其中机器学习、深度学习等技术成为人工智能的主流。并已在语音识别、计算机视觉、自然语言处理等方面取得了巨大突破和进展。
很多人不理解人工智能和机器学习、深度学习之间的关系。具体关系如图1-1所示:
浅谈机器学习与深度学习
从图可知,人工智能、机器学习与深度学习之间是包含关系,并且深度学习是机器学习的分支。
机器学习方法也被称为统计学习方法,顾名思义,机器学习中的大部分学习算法都是基于统计学原理的。因此,机器学习和深度学习技术都具备一个共同点:他们需要使用尽可能多的数据来完成对模型的训练,从而使得最终训练出的模型具有强大的泛化能力。而泛化能力的好坏也是评价模型好坏的标准。

2 M-P模型

M-P模型是模拟人工神经元定义的数学模型,又称神经元模型,其结构示意如下图所示。
浅谈机器学习与深度学习
从上图可看出,首先是一列从x1到xn的参数(从某种程度上也可看做输入数据的特征维度),在输入神经元之前,每个参数需乘以对应的表征该参数重要度的权重值(w1到wn),然后在神经元中进行一定的处理,首先进行数学中的累加运算,将x1w1到xnwn的结果进行累加,然后将求和的结果送入**函数f,M-P模型中的**函数一般选择的是sigmoid函数,其函数图如上图右所示。f是一个有目标阈值的**函数,一般定义完**换丝的阈值后(),通过判断x1w1累加到xnwn的和,与阈值的正负关系,判断最后**函数的输出值(0或1)。
浅谈机器学习与深度学习
通过M-P模型可轻松构造逻辑与、或、非,仅需调整不同的参数组合即可。
M-P模型的权值 W 和偏置都是人为给定的,所以对此模型不存在"学习"的说法。

3 感知机

感知机时一种具有单层计算单元的神经网络模型,结构上与M-P模型极为相似,单层感知机就是多个M-P模型的累叠。不同之处在于感知机的使用初衷是解决数据的分类问题,因为感知机本身就是一种能进行二分类的线性模型。
只要被处理的数据线性可分,感知机模型就能不断进行训练和参数优化,最终得到一个可对数据进行二分类的模型。感知机的数学表达式可借鉴符号函数:
浅谈机器学习与深度学习
sign为符号函数,用wx+b代替x就可转换为感知机的表达式
输入向量x是我们要进行分类的数据,输出结果正负1可被看作数据经过模型计算后最后输出的对应标签,从而将输入数据分为两类。在二维空间中,w
x+b=0对应的就是对输入数据进行二分类的直线,三维空间中,是分类的平面,统称为分割超平面。
M-P模型的权值 WW 和偏置 b 都是人为给定的,所以对此模型不存在"学习"的说法。这也是M-P模型与单层感知机最大的区别,感知机中引入了学习的概念,权值 W 和偏置 b 是通过学习得来。
但单层感知机仅能处理线性可分问题,对于非线性问题(异或问题)没办法,所以引入多层感知机(MLP),也就是单层感知机的叠加(因为非线性问题,可通过线性问题的叠加解决)。单层感知机结构图如下所示。
浅谈机器学习与深度学习
多层感知机结构图如下所示
浅谈机器学习与深度学习