(10)stata的基本使用--短面板数据处理
面板数据处理
数据描述
数据预览:
告诉计算机这是面板数据:
描述变量:
查看其他变量:
绘图:
混合回归
聚类稳健标准误
cluster后的变量表示聚类标准,表示使用以state变量聚类的聚类稳健标准误。
普通稳健标准误
对比普通稳健标准误与聚类稳健标准误(std.err),普通稳健标准误小于聚类稳健标准误。
但是,由于同一州不同时期之间的扰动项存在自相关,并且在使用普通稳健标准误时,默认扰动项微独立同分布,故普通稳健标准误的估计不准确。
固定效应
示例:
这一步我不知道在干啥???
使用固定效应模型还是混合回归模型呢?
示例:
最后一行,拒绝原假设(可以使用混合回归),认为使用固定效应要比混合回归好。但是由于未使用聚类标准误,因此这个F检验并不是最有效的,因为普通标准误仅有聚类标准误的一半。下面考虑LSDV方法。
LSDV法
截取了片段:
同样效果的操作:
上表可知,大多数个体虚拟变量是显著的,即存在个体效应,因此可以放心大胆地使用固定效应模型。
一阶差分法
示例:
我没做出来~,直接截取书中内容。
双向固定效应模型
介绍
在stata中生成时间虚拟变量
部分截图:
示例操作
year1是基期,故其效应由cons项所包含,year的效应均为负值,部分显著,部分不显著。那就检验一下联合显著性吧
显著不为零,也就是year是存在时间影响的。
直接生成双向时间效应模型(无需生成时间虚拟变量)
随机效应模型
介绍
FGLS操作
最后三行:
进行LM检验
检验结果:拒绝原假设(不存在个体随机效应模型),认为应该在随机效应模型与混合回归之间,我们选择随机效应模型。因为如下:
对随机效应模型进行MLE估计
随机效应MLE的系数估计值与随机效应FGLS的估计值不同,但在性质上相似。最后一行拒绝的原假设
σ
u
=
0
\sigma_u=0
σu=0,即认为存在个体随机效应,而拒绝混合回归模型。
选择固定效应还是随机效应,豪斯曼检验
方法
操作
由于P值小于0.05,故强烈拒绝原假设:
u
i
与
x
i
t
,
z
i
不
相
关
u_i与x_{it},z_i不相关
ui与xit,zi不相关,故认为应该使用固定效应模型。
*但是:重点来了,粘贴了,这点没懂~~~~~ *
组间估计
如果数据质量不好,可以考虑采用组间估计,但是会损失很多信息。
示例: