机器学习之简单线性回归


前言中我们可以看到,目标标记为连续型数值的是回归。而回归又分为线性和非线性

1.简单线性回归

很多做决定过程通常是根据两个或者多个变量之间的关系

  • 回归分析(regression analysis):用来建立方程模拟两个或者多个变量之间如何关联
  • 自变量(independent variable):x, 输入(input),被 用来逬行预测的变量
  • 因变量(dependent variable): y.输出(output),被预测的变量
  • 简单线性回归(simple linear regression):简单线性回归包含一个自变量(X)和一个因变量(y),即一元一次函数。两个变量的关系用一条直线来模拟。如果包含两个以上的自变量,则称作多元回归分析(multiple regression)
  • 简单线性回归模型:被用来描述因变量 (y)和自变量(X)以及偏差 (error)之间关系的方程叫做回归模型

机器学习之简单线性回归
其中,β0,β1是参数,ε是偏差

  • 简单线性回归方程
    机器学习之简单线性回归
    为一元一次方程,直角坐标中是一条直线,称为回归线
    其中,β0是截距,β1是斜率,E(y)是在给定一个x下的y的期望值

  • 正向线性关系
    机器学习之简单线性回归
    负向线性关系
    机器学习之简单线性回归
    无关系
    机器学习之简单线性回归

  • 估计的简单线性回归方程
    机器学习之简单线性回归

2.线性回归分析流程

机器学习之简单线性回归
注:b0,b1是样本中数据得到的估计的参数,只能代表某样本的参数; β0,β1是整体样本数据得到的参数

3.线性回归实例

设一周内卖家做电视广告数量与售出汽车数量由如下关系:
机器学习之简单线性回归
如何训练出适合简单线性回归模型的最佳回归线?

最佳回归线应该满足:
机器学习之简单线性回归
即每一个点(Xi,Yi)的Yi与回归线上横坐标为Xi时纵坐标Yi^的差值的平方之和最小
b0,b1(样本中数据得到的估计的参数)的计算公式:
机器学习之简单线性回归
经计算:机器学习之简单线性回归
b1:
机器学习之简单线性回归
b0:
机器学习之简单线性回归
y的估计:
机器学习之简单线性回归
机器学习之简单线性回归
注:y顶上由^代表估计
预测:一周内做广告数为6,预测售出的汽车数量为多少?
机器学习之简单线性回归
更多文章:https://blog.****.net/qq_33208851/article/details/95230847