DID和IV操纵空间大吗? 一切皆为P-hacking

通过对Top 25份经济学期刊里的308篇文章分析,作者发现相对于RDD和RCT而言,DID和IV更加具有操纵空间,为了P值显著性而动手脚的可能性更大(近1/4都在为p值显著进行操纵)。

使用的Top 25期刊名录,来自于Repec的影响因子排名。

作者使用了三种方法去测度四种因果推断方法的可靠性。

第一,是以RCT作为基准组所做的Probit模型。

第二,是Caliper检验,Caliper这个词是比较眼熟的,因为PSM里就有一个Caliper选项,比如,Caliper(0.5),即在这个区间里。

第三,是excess检验,具体见Brodeur et al., 2016。

Source: IZA DP: Methods Matter: P-Hacking and Causal Inference in Economics Abel Brodeur, Nikolai Cook, Anthony Heyes

(0)

相关推荐