机器学习 - 线性回归

线性回归是利用数理统计中回归分析，来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法，运用十分广泛。

前言

微积分基础知识

常用的微积分知识：点此

法则一：对方程机器学习 - 线性回归

机器学习 - 线性回归

法则二：常数的微分为 0
法则三：偏导数可以穿透累加器，即

机器学习 - 线性回归

法则四：微分链接法则，比如 f(x) 是以 x 为自变量的函数，令 J(x) = g(f(x)) ，则 J(x) 的微分方程为

机器学习 - 线性回归

法则五：计算偏导数时，把求导变量当作变量，其他的变量当作常数，比如对方程机器学习 - 线性回归，

机器学习 - 线性回归

因为是对 x 求导，所以可以把 y 当成常数，即机器学习 - 线性回归整个算子就是一个常数，根据第二个法则，常数的导数为 0。同理:

机器学习 - 线性回归

正文

预测函数

因为是线性模型，所以 J(θ1,θ2)= h(x) =θ1x +θ0。根据机器学习的概念，我们进行学习的目的就是要使得 h(x) 的整体误差，即每一个点到这条线的距离之和最小。要达到这个目的，我们就要找到最合适的θ1和θ0，这两个参数就被成为模型参数。

成本函数

单变量线性回归算法的成本函数是:

机器学习 - 线性回归

其中， h(x)-y(x) 是预测值和实际值的差，故成本就是预测值和实际值的的平方的平均值。乘 1/2 是为了后面的计算方便。这个函数也称为均方差方程。

梯度下降算法

有了成本函数，我们就需要用方法把成本函数降到最小，这也正是机器学习的目的。所以我们引入了梯度下降算法的概念。

梯度下降法的基本思想可以类比为一个下山的过程。假设这样一个场景：一个人被困在山上，需要从山上下来 (i.e. 找到山的最低点，也就是山谷)。但此时山上的浓雾很大，导致可视度很低。因此，下山的路径就无法确定，他必须利用自己周围的信息去找到下山的路径。这个时候，他就可以利用梯度下降算法来帮助自己下山。具体来说就是，以他当前的所处的位置为基准，寻找这个位置最陡峭的地方（最斜的地方），然后朝着山的高度下降的地方走，同理，如果我们的目标是上山，也就是爬到山顶，那么此时应该是朝着最陡峭的方向往上走。然后每走一段距离，都反复采用同一个方法，最后就能成功的抵达山谷。

机器学习 - 线性回归

用更加数学的语言来描述上面这个过程就是：我们任选一组θ1和θ0，然后求成本函数在这一点的偏导数（因为有两个参数），此处这个偏导数就是上面那个故事里的斜率。我们要做的就是不断地迭代θ1和θ0。由当前θ的值，根据该点的偏导数，算出在该点的斜率，再乘学习率α，我们就可以让θ往“山谷下”迈上一步。
用数学表达我们不停迭代θ的过程可以采用以下公式：

机器学习 - 线性回归