Stata 多元线性回归模型建立及检验
——关于这篇笔记,有的人嘴上说着不想写,下笔实际上很快乐。
第一步 导入excel文件
clear #清除所有变量cd D:\stata_data #数据保存的地址import excel sample.xlsx, firstrow #导入数据,文件名为sample.xlsx,把第一行作为变量名tsset t#建立时间序列 若不存在时间变量可忽略
此处以x1,x2,x3,x3作为自变量,y作为因变量,t为时间变量。
若需建立对数模型,则可利用generate生成新变量。
generate logy = log10(y)#生成变量名为logy的新变量
第二步 多变量线性回归
regress y x1 x2 x3#对模型进行最小二乘法估计
运行结果
回归方程:
第三步 多重共线性检验
estat vif#方差扩大因子法检验
当VIF≥10,则认为自变量之间有严重的多重共线性。
运行结果
若模型出现多重共线性,可以剔除一些不重要的解释变量,或增大样本量。
第四步 异方差检验
imtest,white#White检验
如果输出的P-Value显著小于0.05,则拒绝原假设,认为存在异方差性。
运行结果
若模型出现异方差性,则不能用普通的最小二乘法进行估计,需要对原模型进行变换,使之满足同方差性假设,然后进行模型参数估计。通常可以采用加权最小二乘法(weighted least square,WLS)或BOX-COX变换法。
第五步 序列相关性检验
首先保证所用的数据必须为时间序列数据。
如果原数据不是时间序列数据,则需要自行定义一个:
gen n=_n #生成一个时间序列的标志变量n tsset n #将这个数据集定义为依据时间序列标志变量n定义的时间序列数据
接下来介绍三种检验方法
(一)残差图检验
predict e,r#生成残差值escatter eLe#生成残差散点图
运行结果
(二)DW检验(一阶自相关问题的常用检验法)
estat dwatson#DW检验
经验上,DW值在1.8-2.2之间时接受原假设,说明模型不存在一阶自相关,若DW值接近0或4,则拒绝原假设,认为存在一阶自相关。若落在模糊区域,则无法判断。
运行结果
(三)BG检验
estat bgodfrey#BG检验(默认检验一阶自相关)
若输出的P-Value显著小于0.05,则拒绝原假设,认为存在序列相关。
运行结果
若模型出现自相关,可以考虑用利用Cochrane-Orcutt迭代法进行修正。
后记:一个人往往会在他逃离命运的路上遇见命运,就如同此刻明明不想写论文,但是为了查资料不小心点进来的你一样,嘻嘻。
赞 (0)