机器学习之简单线性回归
在前言中我们可以看到,目标标记为连续型数值的是回归。而回归又分为线性和非线性
1.简单线性回归
很多做决定过程通常是根据两个或者多个变量之间的关系
- 回归分析(regression analysis):用来建立方程模拟两个或者多个变量之间如何关联
- 自变量(independent variable):x, 输入(input),被 用来逬行预测的变量
- 因变量(dependent variable): y.输出(output),被预测的变量
- 简单线性回归(simple linear regression):简单线性回归包含一个自变量(X)和一个因变量(y),即一元一次函数。两个变量的关系用一条直线来模拟。如果包含两个以上的自变量,则称作多元回归分析(multiple regression)
- 简单线性回归模型:被用来描述因变量 (y)和自变量(X)以及偏差 (error)之间关系的方程叫做回归模型
其中,β0,β1是参数,ε是偏差
-
简单线性回归方程:
为一元一次方程,直角坐标中是一条直线,称为回归线
其中,β0是截距,β1是斜率,E(y)是在给定一个x下的y的期望值 -
正向线性关系:
负向线性关系:
无关系: -
估计的简单线性回归方程:
2.线性回归分析流程
注:b0,b1是样本中数据得到的估计的参数,只能代表某样本的参数; β0,β1是整体样本数据得到的参数
3.线性回归实例
设一周内卖家做电视广告数量与售出汽车数量由如下关系:
如何训练出适合简单线性回归模型的最佳回归线?
最佳回归线应该满足:
即每一个点(Xi,Yi)的Yi与回归线上横坐标为Xi时纵坐标Yi^的差值的平方之和最小
b0,b1(样本中数据得到的估计的参数)的计算公式:
经计算:
b1:
b0:
y的估计:
注:y顶上由^代表估计
预测:一周内做广告数为6,预测售出的汽车数量为多少?
更多文章:https://blog.****.net/qq_33208851/article/details/95230847