Stata 多元线性回归模型建立及检验

——关于这篇笔记,有的人嘴上说着不想写,下笔实际上很快乐。

第一步 导入excel文件

clear #清除所有变量cd D:\stata_data #数据保存的地址import excel sample.xlsx, firstrow #导入数据,文件名为sample.xlsx,把第一行作为变量名tsset t#建立时间序列 若不存在时间变量可忽略

此处以x1,x2,x3,x3作为自变量,y作为因变量,t为时间变量。

若需建立对数模型,则可利用generate生成新变量。

generate logy = log10(y)#生成变量名为logy的新变量

第二步 多变量线性回归

regress y x1 x2 x3#对模型进行最小二乘法估计

运行结果

回归方程:

第三步 多重共线性检验

estat vif#方差扩大因子法检验

当VIF≥10,则认为自变量之间有严重的多重共线性。

运行结果

若模型出现多重共线性,可以剔除一些不重要的解释变量,或增大样本量。

第四步 异方差检验

imtest,white#White检验

如果输出的P-Value显著小于0.05,则拒绝原假设,认为存在异方差性。

运行结果

若模型出现异方差性,则不能用普通的最小二乘法进行估计,需要对原模型进行变换,使之满足同方差性假设,然后进行模型参数估计。通常可以采用加权最小二乘法(weighted least square,WLS)或BOX-COX变换法。

第五步 序列相关性检验

首先保证所用的数据必须为时间序列数据。

如果原数据不是时间序列数据,则需要自行定义一个:

gen n=_n #生成一个时间序列的标志变量n
 tsset n #将这个数据集定义为依据时间序列标志变量n定义的时间序列数据

接下来介绍三种检验方法

(一)残差图检验

predict e,r#生成残差值escatter eLe#生成残差散点图

运行结果

(二)DW检验(一阶自相关问题的常用检验法)

estat dwatson#DW检验

经验上,DW值在1.8-2.2之间时接受原假设,说明模型不存在一阶自相关,若DW值接近0或4,则拒绝原假设,认为存在一阶自相关。若落在模糊区域,则无法判断。

运行结果

(三)BG检验

estat bgodfrey#BG检验(默认检验一阶自相关)

若输出的P-Value显著小于0.05,则拒绝原假设,认为存在序列相关。

运行结果

若模型出现自相关,可以考虑用利用Cochrane-Orcutt迭代法进行修正。

后记:一个人往往会在他逃离命运的路上遇见命运,就如同此刻明明不想写论文,但是为了查资料不小心点进来的你一样,嘻嘻。

(0)

相关推荐

  • 统计计量丨​一文详细解读回归模型中的异方差问题,让您不再困惑!

    本文转载自公众号简单易学的计量经济学 当你在写实证论文的时候,经常会发现回归模型参数显著性在很多时候并不符合预期,当然这存在很多方面的影响, 比如变量间存在多重共线性.残差存在一阶或高阶自相关或者残差 ...

  • 两阶段最小二乘法TSLS案例分析

    两阶段最小二乘回归(2sls回归)是解决内生性问题的常用方法.上文中对两阶段最小二乘法做了基本介绍,本文将通过案例说明具体操作步骤. 1 背景 本案例引入Mincer(1958)关于工资与受教育年限研 ...

  • 练习R:用3d空间图展示多元线性回归模型

    做多元线性回归模型,你有没有想过如何用图形展示回归模型呢?目的是直观的观察和感受什么线性回归. 一元线性回归,我们直接做一个带拟合直线的散点图即可.如果是一个多元线性回归模型,普通的散点图就解决不了. ...

  • R语言贝叶斯MCMC:用rstan建立线性回归模型分析汽车数据和可视化诊断

    原文链接 http://tecdat.cn/?p=23255 本文将谈论Stan以及如何在R中使用rstan创建Stan模型.尽管Stan提供了使用其编程语言的文档和带有例子的用户指南,但对于初学者来 ...

  • 多元线性回归的模型解释、假设检验、特征选择

    线性回归是最流行和讨论最多的模型之一,它无疑是深入机器学习(ML)的入门之路.这种简单.直接的建模方法值得学习,这是进入ML的第一步. 在继续讨论之前,让我们回顾一下线性回归可以大致分为两类. 简单线 ...

  • Stata17:面板数据多元logit模型

    引言 多元logit (MNL)模型是一种流行的方法,用于建立没有自然排序结果的分类选择模型,如职业.政党或餐厅选择. 在logit/panel数据中,我们随时间观察一系列结果.比如说,我们每周都会观 ...

  • NSG-SGM3转基因小鼠模型建立

    系统命名:NOD.Cg-Prkdcscid Il2rgtm1Wjl Tg(CMV-IL3,CSF2,KITLG)1Eav/MloySzJ 普通命名:NSGS, NSG-SGM3, NOD-scid I ...

  • 深度学习模型建立的整体流程和框架

    框架图如下,纵向是建立模型的主要流程,是一个简化且宏观的概念,横向是针对具体模块的延展. 数据处理 数据处理一般涉及到一下五个环节: 读入数据 划分数据集 生成批次数据 训练样本集乱序 校验数据有效性 ...

  • 小鼠心血管疾病模型建立(一):心肌梗死

    背景及病因 心肌梗死是指心肌的缺血性坏死,由于冠状动脉部分或完全闭塞导致部分心肌因持久性缺血缺氧而发生局部坏死,心肌无法得到足够氧气,最终导致心肌不可逆的缺血性坏死,心脏的收缩和舒张功能障碍,机体供血 ...

  • R语言用线性回归模型预测空气质量臭氧数据

    原文链接:http://tecdat.cn/?p=11387 尽管线性模型是最简单的机器学习技术之一,但它们仍然是进行预测的强大工具.这尤其是由于线性模型特别容易解释这一事实.在这里,我将讨论使用空气 ...

  • 人源抗体基因小鼠模型建立有哪些策略与方法?

    利用小鼠模型研制人源抗体的策略,即应用小鼠免疫系统,通过人源抗体基因在小鼠体内重组和体细胞高突变的自然发生过程,生产针对不同免疫原的多样性组合,且有特异性的人源抗体.人源抗体基因小鼠模型的建立,为治疗 ...