数学建模--多元线性回归分析
一、回归分析的介绍和分类
1 回归分析
研究X与Y之间相关性的分析
1.1 相关性
相关性≠因果性
1.2 Y
因变量/核心变量
连续数值型变量
0-1型变量
定序变量
计数变量
生存变量
1.3 X
研究X与Y的相关关系,得到Y的形成机制,通过X去预测Y
2 回归分析的使命
3 回归分析的分类
二、数据的分类以及数据的来源
1 数据的分类
1.1 横截面数据
在同一时间点收集的不同对象的数据
1.2 时间序列数据
对同一对象在不同时间连续观察得到的数据
1.2 面板数据
综合了横截面数据和时间序列数据
1.3 不同数据类型的处理方法
2 数据的收集(宏观数据)
详见pdf第14页
三、对于线性的理解以及内生性问题的探究
1 一元线性回归
本质上和拟合是一样的
残差
2 对于线性的理解
3 回归系数的解释
只需要分析回归系数的意义.即0.19和-1.74,无需分析没有意义的5.3
遗漏的变量,即价格!
所以加入了价格这个变量,就改变了产品品质评分的回归系数.
4 外生性的概念以及内生性的探究
误差项包含了什么? 它包含了价格
5 内生性的蒙特卡罗模拟(内生性的危害)
如果我们忽略了一个变量,就会出现这个问题.
相关系数越大,说明内生性越严重(误差项u和所有的自变量x的相关性)
6 核心解释变量和控制变量
保证核心解释变量和扰动项不相关.
控制变量:
四、四种模型的解释、虚拟变量的设置以及交互项的解释
1 回归系数的解释
2 什么时候取对数
即百分比的变化而不是数值的变化.
3 四类模型回归系数的解释
3.1一元线性回归
3.2双对数模型
3.3半对数模型 y = a+b ln(x)
3.4半对数模型 ln(y) = a+bx
4.定性变量如何处理
引入虚拟变量
当famale = 1表示女性,famale = 0 表示男性
f
5.例:是否存在歧视
想要计算出回归系数,必须不存在完全多重共线性的影响,引入的东西多了就会存在这个问题.
就是为了防止这个问题.
6.含有交互项的自变量
偏导 bdrms
6.17的结果,说明了住房面积越大,价格上升越多.
交互效应
显著大于0就是正向的.