数学原理之机器学习中的梯度概念

导数:

一个函数在某一点的导数描述了这个函数在这一点附近的变化趋势和变化率,以物体的上抛运行为例,其(位置-时间),(速度-时间),以及(加速度-时间)的曲线可以用下图表示:

其中(速度-时间)曲线是(位置-时间)曲线在每一点的导数的值的集合,同样道理,(加速度-时间)曲线是由(速度-时间)求导得到。

以图为例,一开始,位置的变化率比较快,反映的是速度曲线的速度值比较大,随着时间推进,位置曲线随时间的变化率逐渐变小,以至于最终达到最高点和水平x轴平行,速度则逐渐减小到0,标识速度逐渐趋于小以至于达到0,对应物体达到上抛物最高点速度变为0静止。

位置函数达到最高点后,速度变化率开始从小变大,对应速度曲线从0开始逐渐变大,符号标识方向和上抛相反,最终在4秒时刻,物体到达原来抛物位置。速度达到最大,也就是上抛给定的初始速度。

同样的分析,速度曲线是一条斜率为-2的直线,表示速度的变化率和变化趋势是-2,在整个过程中稳定变化,在物理里面有一个专门的名字描述它,叫做加速度。

所以加速度曲线是一个固定的常数值.

数学原理之机器学习中的梯度概念

多元函数:

初等数学遇到的大部分是一元函数的情况,也就是导致因变量产生变化的因素只有一个,但大多数情况下,决定因变量的因素可能并非只有一个,以某个地区的房价为例,导致房价变动的因素还可能包括,面积,学区划分,地段,交通,城市规模等等。每个因素也可以作为自变量,自变量不为1个的函数叫做多元函数。

偏导数:

  第一条说了,导数是函数值关于自变量的变化率,但是多元函数有多个自变量,每个自变量可以独立*变化,那么它的函数值的变化率该如何得到呢?

 还是以房价为例,如果房价和面积,交通,学区三个因素有关,

数学原理之机器学习中的梯度概念, x代表面积,y代表交通,z标识学区。
可考虑先把交通和学区固定,考虑面积的微小变化对房价产生的影响,表示成:

数学原理之机器学习中的梯度概念

同理,分别再把面积和交通固定,以及面积和学区固定在某一个点,得到分别对于交通和学区的变化率.

数学原理之机器学习中的梯度概念数学原理之机器学习中的梯度概念

这种在多元函数中,将其他变量看做常数,按照求导法则,计算针对某个变量的导数,叫做偏导数.偏导数每次只使一个自变量发生变化,所以计算过程和计算一元函数的导数过程无异。

说到这里,实际上已经和梯度发生联系了,数学原理之机器学习中的梯度概念实际上就代表了梯度.

比如函数:

    数学原理之机器学习中的梯度概念

求偏导的结果为:

 数学原理之机器学习中的梯度概念

   数学原理之机器学习中的梯度概念

梯度:

  百度百科对梯度的定义,梯度的本意是一个向量(矢量),表示某一函数在该点处的方向导数沿着该方向取得最大值,即函数在该点处沿着该方向(此梯度的方向)变化最快,变化率最大(为该梯度的模)

设圆锥的方程为:

数学原理之机器学习中的梯度概念

其中,a为变参,这里取a=2

则针对曲面上每一个点P(x,y), 其梯度可以定义为

数学原理之机器学习中的梯度概念

其中

数学原理之机器学习中的梯度概念

同理

数学原理之机器学习中的梯度概念

所以,在椎体的任意一点,梯度向量为

数学原理之机器学习中的梯度概念

记做:

 数学原理之机器学习中的梯度概念

 特殊情况下,在y=0截面和x=0截面与圆交线上的点的梯度为

数学原理之机器学习中的梯度概念

 如下图所示,由于梯度在另一个方向上的分量为0,所以梯度向量在坐标轴方向上达到最大,这和直觉是相符的。

直觉上,不论从圆锥上哪个点触发,它的梯度的大小是一样的(方向不一样),我们可以验证一下

数学原理之机器学习中的梯度概念

所以

数学原理之机器学习中的梯度概念

=数学原理之机器学习中的梯度概念

所以,圆锥上任意一点的梯度大小均为a,处处相等,包括上面计算得到的和坐标轴平面相交的两条线。

数学原理之机器学习中的梯度概念叫做二维空间向量梯度算子,

数学原理之机器学习中的梯度概念

数学原理之机器学习中的梯度概念

下图中的v1向量即是梯度向量

数学原理之机器学习中的梯度概念

还可以从方向导数的角度来解释梯度的概念,所谓方向导数,就是指函数f(x,y)沿着直线L变化的速率,这条直线其实就是曲面上相对应的那条曲线在xoy平面的投影,完成投影的这个竖立的平面就称为投影平面,那么,方向导数其实就是空间曲线沿着它自己在xoy平面的投影直线的变化率。正如dy/dx表示二维平面中一条曲线在某一点沿着x轴的变化速率(也就是切线的斜率)一样.

首先看一下方向导数的定义:

数学原理之机器学习中的梯度概念

转换成如下的形式:

数学原理之机器学习中的梯度概念

角theta是直线l和x轴的夹角.

那么,方向导数在L指向何方的时候取得最大值呢?

数学原理之机器学习中的梯度概念

是方向L上的单位向量,

则方向导数可以写成:

数学原理之机器学习中的梯度概念

其中fai角是投影直线L和梯度的夹角,不难得出,当fai角为0时,方向导数取得最大值,换句话说,当方向导数和梯度同向时,变化率最大.

方向导数的最大值即是梯度:

数学原理之机器学习中的梯度概念

结束!