Matrix derivatives(矩阵求导)

11.对于一个函数f:Matrix derivatives(矩阵求导)为一个m*n矩阵到实数的映射。定义f对于A的导数为:

Matrix derivatives(矩阵求导)

Af(A)也是一个m*n的矩阵,其中的元素(i,j)为∂f/∂Aij。

Matrix derivatives(矩阵求导)



22.同样,引入迹(trace)的概念。

对一个n*n的矩阵A,迹定义为矩阵A的对角线元素之和。
Matrix derivatives(矩阵求导)

如果a是一个实数(i.e., a 1-by-1 matrix),则tr a=a。迹的性质如下,

Matrix derivatives(矩阵求导)

33.给定一个训练集,定义X是一个m*n的矩阵,其每行的值为训练集的输入值(m为训练集的样例数)

Matrix derivatives(矩阵求导)

向量y是一个m*1的向量,对应训练集中每个Xi的目标值

因为Matrix derivatives(矩阵求导)所以很容易得到如下的定义,

Matrix derivatives(矩阵求导)


又已知Matrix derivatives(矩阵求导),得


Matrix derivatives(矩阵求导)

因而为了得到最小J,由迹的性质的2、3可得5如下

Matrix derivatives(矩阵求导)

44.所以,得到使得代价函数最小的Matrix derivatives(矩阵求导)Matrix derivatives(矩阵求导)













#