两阶段最小二乘法TSLS案例分析

两阶段最小二乘回归(2sls回归)是解决内生性问题的常用方法。上文中对两阶段最小二乘法做了基本介绍,本文将通过案例说明具体操作步骤。

1 背景

本案例引入Mincer(1958)关于工资与受教育年限研究的数据。案例数据中包括以下信息,如下表格:

数据共有12项,其中编号为1,5,7,8,12共五项并不在考虑范畴。

本案例研究'受教育年限’对于'Ln工资’的影响。明显的,从理论上可能出现'双向因果关系’即'受教育年限’很可能是内生变量。那么可考虑使用'母亲受教育年限’和'成绩’这两项数据作为工具变量。同时研究时纳入3个外生变量,分别是'婚姻’,'是否大城市'和’当前单位工作年限’。使用两阶段最小二乘TSLS回归进行解决内生性问题。

本案例研究时,工具变量为2个,内生变量为1个,因而为过度识别,可以正常进行TSLS回归。

2 理论

两阶段最小二乘回归,其内部原理上共分为两次回归。第一次回归将内生变量与工具变量,外生变量进行回归,并且得到回归预测值Prediction;第二次回归将被解释变量与Prediction,外生变量进行回归,得到最终模型结果。第一次回归为中间过程值,SPSSAU并没有输出,如果有需要可自行使用线性回归或OLS回归进行即可。

  • 关于内生性的检验Durbin-Wu-Hausman检验,其用于检验是否真的为内生变量;如果说检验不通过(接受原假设),那么说明没有内生变量存在,可直接使用OLS回归即可。当然即使没有内生性,一般也可以使用TSLS回归,没有内生性问题时,OLS回归和TSLS回归结论通常一致;

  • 关于过度识别检验上,SPSSAU提供Sargan检验和Basmann检验(使用任意其一即可),原理上此过度识别检验仅在'过度识别’时才会输出,即工具变量个数>内生变量个数时,才会输出。

3 操作

本案例分别将被解释变量,内生变量,工具变量和外生变量纳入对应的模型框中,如下:

4 SPSSAU输出结果

SPSSAU共输出6类表格,分别是研究变量类型表格,2sls模型分析结果表格,2sls模型分析结果-简化格式表格,模型汇总(中间过程)表格,Durbin-Wu-Hausman test外生性检验(test of exogeneity)和过度识别检验(overidentifying restrictions)。说明如下:

上一表格展示本次研究时涉及的各变量属性,包括被解释变量,内生变量,工具变量和外生变量组成情况。

上表格列出TSLS两阶段最小二乘回归的最终结果(第二阶段结果),首先模型通过Wald 卡方检验(Wald χ² =244.172,p=0.000<0.05),意味着模型有效。同时R方值为0.342,意味着内生和外生变量对于工资的解释力度为34.2%。具体查看内生和外生变量对于被解释变量'工资’的影响情况来看:

受教育年限的回归系数值为0.112(p=0.000<0.01),意味着受教育年限会对工资产生显著的正向影响关系。

婚姻(已婚为1)的回归系数值为0.167(p=0.000<0.01),意味着相对未婚群体来讲,已婚群体的工资水平明显会更高。

是否大城市(1为大城市)的回归系数值为0.145(p=0.000<0.01),意味着相对来讲,大城市样本群体,他们的工资水平明显会更高。

当前单位工作年限的回归系数值为0.036(p=0.000<0.01),意味着当前单位工作年限会对工资产生显著的正向影响关系。

总结分析可知:受教育年限, 婚姻,是否大城市, 当前单位工作年限全部均会对工资产生显著的正向影响关系。

上表格展示模型的基础指标值,包括模型有效检验wald卡方值(此处提供wald卡方非F检验),R值,Root MSE等指标值。

Durbin-Wu-Hausman test用于检验解释变量X(即内生外量)是否均为外生变量(即是否不存在内生变量)

从上表可知,本次研究纳入的内生变量为'受教育年限’,Wu-Hausman检验显示拒绝原假设(p=0.047<0.05),意味着'所有解释变量均外生’这一假设不成立。即意味着'受教育年限’是内生变量。同时也可使用Durbin检验,一般情况下使用Durbin-Wu-Hausman检验较多。

特别提示:

如果无法拒绝原假设,那么说明研究的内生变量并不是真正意义上的内生变量,那么此时可考虑直接使用OLS回归结果即可,但多数时候也可直接使用TSLS两阶段最小二乘的结果,似研究者专业理论知识综合而定。

过度识别检验用于检验工具变量是否为外生变量,本次研究涉及工具变量为2个,分别是'母亲受教育年限’和'成绩’。从上表可知,过度识别Sargan检验显示接受原假设(p=0.874>0.05),同时Basmann检验也显示接受原假设(p=0.874>0.05)。同说明无法拒绝'工具变量外生性’这一假定,模型良好。

特别提示:

  • 过度识别检验用于判断'工具变量的外生性’,SPSSAU提供Sargan和Basmann检验,使用其一即可

  • 工具变量个数>内生变量个数,即过度识别时,才会有效;如果恰好识别(工具变量个数=内生变量个数),此时无法输出检验值。

5 剖析

涉及以下几个关键点,分别如下:

  • 内生变量和外生变量,其二者均为解释变量,如果考虑内生性问题时才会将解释变量区分成内生变量和外生变量。

  • 模型有效性检验上,SPSSAU默认使用wald卡方检验而非F检验。

(0)

相关推荐

  • 统计计量丨​一文详细解读回归模型中的异方差问题,让您不再困惑!

    本文转载自公众号简单易学的计量经济学 当你在写实证论文的时候,经常会发现回归模型参数显著性在很多时候并不符合预期,当然这存在很多方面的影响, 比如变量间存在多重共线性.残差存在一阶或高阶自相关或者残差 ...

  • 一文读懂内生性问题之两阶段最小二乘法TSLS

    TSLS,即两阶段最小二乘回归.是用于解决内生性问题的一种方法,除TSLS外还可使用GMM估计. 内生变量是指与误差项相关的解释变量.对应还有一个术语叫'外生变量',是指与误差项不相关的解释变量. 产 ...

  • R语言工具变量与两阶段最小二乘法

    原文链接:http://tecdat.cn/?p=5374 我们要估计的模型是 其中 是解释变量, 和 是我们想要估计的系数.x是控制变量,d是治疗变量.我们对我们治疗d对y的影响特别感兴趣. 生成数 ...

  • 案例分析——一个简单的绩效方案,逼出两个养猪高手

    首先解释一下,这里说的绩效方案,是我们对饲养员实施的绩效考核方案,多干.干好的可以多挣钱:而养猪高手,也并不是养猪的全面手,而只是在某一方面有过人之处. 那是二十年前的一个小猪场,规模二百头母猪:在配 ...

  • 案例分析——数猪,这么简单的事,却难倒了两个大学生

    十几年前,我在一个大型猪场负责生产管理:当时的统计员是一位六十年代的高中生,因为时代的原因,耽误了高考:但他的智力非常好,特别是每栋猪舍的猪,一次就能数清楚:但因为另有重用,需要找新的统计员. 正好, ...

  • 两个典型8050三极管开关电路应用案例分析

    基于8050三极管作为案例来对三个典型的开关电路进行分析,希望大家对该种管子有更深入的了解.本文整理的内容如下.   一.8050三极管发射极跟随开关电路   在实际电路设计中需要考虑8050三极管V ...

  • 两桶油概念中国石油案例分析主力虚张声势的诱多手法

    在正常的交易盘口中个股涨停一般大封单都挂在涨停的价格等候成交,很明显,中国石油开盘涨停后到现在在涨停的价格12.14元下的两个价格12.12元挂着的51000多手买单不是一般的等候买入挂单交易行为.在 ...

  • 案例分析——为了了解员工的想法,我专门喂了两天育肥猪

    我一直认为,做为一个管理者,如果不了解下属心里想什么,会是非常难管的:所以,在我的一生中,想把自己从事的工作都体验一下:养猪的工作,我几乎都干过,有些是被动的,有些却是主动去干的. 记得在一个小猪场的 ...

  • 三菱两轴定位案例分析(建议收藏)

    PLC发烧友 492篇原创内容 公众号 今天给大家分享一篇两轴定位案例分析 注意:此程序非完整运行程序,主要是想让大家理解定位指令配合变址节约程序步,简化程序内容用.且两轴是在同时运行,如是十字滑台, ...

  • 案例分析——吃一斤料,长一斤三两猪,诀窍却在这里

    少吃料,多长肉,是每个养猪人的愿望:但再好的愿望,也必须附合实际. 料肉比,更确切地说是料重比,是指长一斤体重需要消耗多少饲料:猪相对于牛羊来说,饲料利用率高很多:我们上学的时候,书上记载,牛羊的料重 ...