多元线性回归

在上一周的视频中我们学习了多元线性回归这一节。刚开始看的时候有一些懵,不过慢慢看到后面的时候有些懂了,有了一些自己的理解。
首先在高中的时候我们学习过一元线性回归方程,它的公式是y_=ax+b。但是它只能表示一个自变量x与因变量y之间的关系,但是在我们现实生活中,有很多结果不是只受到一个因素影响,比如影响房价的因素有房子的大小,还有房子的地理位置,还有房子的楼层等等一些因素。但是由于各个因素对于房价的影响程度不同,就比如说房子的大小对房价的影响程度比房子的楼层更大。所以我们就又引入参数θ来表示各个因素(自变量)对结果(因变量)的影响程度。于是我们就得出多元线性回归方程的公式为:y_=θ0+θ1x1+θ2x2+…+θnxn。这时我们可以把(θ1,θ2,…θn)和(1,x1,x2…xn)看出是一个向量。于是(θ1,θ2,…θn)的转置(1,x1,x2…xn)=y_。记作hθ(x)=θ的转置*x。
那我们应该如何求出参数θ呢?因为我们预测出的这个y_值和真实值y是有误差的,所以我们就设 这个误差为@,[email protected]所以只要我们求出当使误差最小时此时对应的θ就是我们所要求的θ。因为最小二乘法的定义为:我们设预测值和真实值之间的误差为@,让@的平方取最小值时,看看此时的参数θ为何值,这个就是最下二乘法的定义。所以我们就可以使用最小二乘法来对模型的参数进行求解。

多元线性回归