审稿人有义务告诉你回归中可能的遗漏变量么?
前不久,社群讨论了1.“显著不显著的后背是什么, 非(半)参估计里解决内生性”,2.“计量社群里关于使用交互项还是中介效应分析开展机制研究的讨论”,3.“为啥面板数据回归中, 即使X对Y的解释程度很大, 但R-square一般都很小?”,4.多期DID中使用双向固定效应可能有问题! 又如何做平行趋势检验? 多期DID方法的最新进展如何?,5.收入和年龄等变量是将其转化成有序离散变量还是当成连续变量进行回归呢?6.控制变量就能影响结果显著性, 所以存在很大操作空间, 调参数是常用手段吗?等等。这些讨论中有很多非常高质量的内容值得被记录起来,因此后面会形成一个计量圈社群讨论专栏。
感谢社群群友的讨论,此处列出了参与讨论的部分群友。
背景知识:1.如何测度不可观测变量遗漏的严重程度, 建议各位学者看过来!2.双胞胎样本解决遗漏变量和测量误差, LIV解决选择偏差,3.因果推断中遗漏不可观测变量多严重? 通过可观测变量检测,4.必读|遗漏变量偏误对于因果推断的影响, 及在各种政策评估方法中可能的解决方法,5.忽略干扰因素,内生性,遗漏变量偏差及相关问题下的估计,6.最全估计方法,解决遗漏变量偏差,内生性,混淆变量和相关问题
针对“回归中常数项显著说明模型中有遗漏变量问题?”问题,各位学者都提出了自己的见解。
李家翔:
一般截距项,即使显著,可以不展示,或者说没有错。但是是否遗漏变量,这个其实是有争议的,并非是说完全不可能,要看研究的场景。比如之前看到一篇 APPL ECON PERSPECT P[Golino, Ralston, and Guthrie (2020)] 的,在FE中,作者认为遗漏变量带来的残差误差被吸收到了截距上,因此截距显著。作者的回归中,加入更多的变量(包括固定效应)后,截距的确是变得不显著了,一些时间固定效应被识别显著了,因此还是要具体的假设。
冯晗:
我觉得是提问的人断章取义了。通常来说截距项跟误差项没什么关系,显著也不说明什么问题。但在某些情况下,比如在某些DID模型当中,显著的截距项可能是分组非随机的信号,那这时候说截距项显著说明有遗漏变量就没什么问题。
R.S.E:
不过,社群群友Liu还是坚持自己的意见:
于是,又展开了如下讨论: