关于内生性问题中寻找工具变量思路手册
来源:计量经济圈、 经管定量笔记
NO.01
内生性来源
假设对于得到参数的一致估计至关重要,该假设意味着解释变量与扰动项不相关。事实上,该假设是OLS能够成立的最为重要的条件。但与此同时,该假设又过于严格或者过于理想化,实际的经济问题研究中经常会发现解释变量与扰动项相关。由于
会导致参数估计不一致,因此,解释变量与扰动项相关便产生了我们常说的内生性问题。又由于
在实践中很难得到满足,因此,内生性问题是一个大家都普遍面临和绕不开的问题。
:
,也就是说,实际观测到的是
,真实无偏差的却是
,当对模型进行估计时,测量误差项
会进入扰动项,进而使得
,因此,解释变量的测量误差会导致内生性。陆铭老师以前特意写了个短评,强调对于核心解释变量一定要能够准确地度量,不要似是而非含糊不清,更不要用“用xxx来代理核心解释变量”。
。
。在实际做论文的过程中,反向因果问题应当是最需要重点关注和考虑的内生性问题了,这一点在公司财务问题研究中表现得似乎更为明显,主要是因为财务报表里的各项基本都相互联系和影响。
NO.02
工具变量法介绍
。为了比较直观地感受内生性的存在对参数估计一致性的影响,下面以遗漏变量偏误为例简单推导一下。
。对于模型(2),变量X的参数估计值为:
,将模型(1)中真实的Y代入到这个表达式里有:
。
时,有
,此时解释变量X的参数一致性不受影响。反之,当遗漏的变量T与X相关时,有
。
;
。该条件意味着,工具变量只能通过内生变量对被解释变量产生影响,而不能有其他的路径或渠道。
,从而
,当工具变量的相关性满足时(保证分母不为0),有下式成立:
。将模型(1)中真实的Y代入到这个表达式里,我们便可以进一步得到:
,而工具变量估计量为:
。通过对比我们可以得到几点结论:
,则无法定义工具变量法;
,
,进行OLS回归之后得到X的拟合值
。因为工具变量Z与扰动项v不相关,从而拟合值
也与扰动项v不相关。在第二阶段时,我们有
,此时便能得到一致估计。
以及余下的与扰动项相关的部分
,然后被解释变量仅对外生的部分
进行回归。这一逻辑还可以这样理解:
,这时有:
NO.03
寻找工具变量的思路
NO.04
工具变量发的相关检验与注意事项