双重差分倾向得分匹配(PSM-DID)
寄语
感谢各位计量粉对计量粉一直以来的不离不弃,这几天有人问双重差分倾向得分匹配,小编下班后为大家查找相关资料,为大家推送这一篇文章。
PSM-DID基本介绍
双重差分PSM模型是由Heckman et al(1997,1998)提出的。假设存在两期面板数据,实验前的时期记为t’,实验后的数据记为t。对于控制组合处理组在t’时期,其潜在结果均为yot‘,但是在t时期的时候存在两种潜在结果即,控制组为y0t,处理组为y1t。
双重差分PSM模型成立的假设为:
如果以上假定成立,则可以得到ATT的一致估计:
步骤
双重差分PSM的估计步骤大致如下:
(1)根据处理变量D和协变量X计算倾向得分
(2)对于处理组的每个个体i确定与其匹配的全部控制组个体(即确定集合Sp)
(3)对于处理组的每位个体i,计算其结果变量前后变化
(4)对于处理组的每个个体i,计算与其匹配的全部控制个体的前后变化
(5)针对(3)和(4)中的公式,根据以上公式进行倾向得分核匹配或局部线性回归匹配,即可得到ATT
优点:
控制不可观测但不随时间变化的组间差异。例如处理组和控制组来自两个不通过的区域,或者处理组或者控制组使用了两套调查问卷。
操作
***PSM_DID
ssc install diff
help diff
***双重差分语法格式***
diff outcome_var ,treat(varname) period(varame) id(varname) ///
kernel ktype(kernel) cov(varlist) report logit support test
解释
其中“outcome_var”表示结果变量,“treat(varname) ”为必选项,用来指定处理变量,“period(varame)”用来指定实验期虚拟变量(1=实验期,0=非实验期),“id(varname)”用来指定个体id(这是进行匹配的前提),“kernel”表示使用核匹配方法(diff命令不提供其他匹配方法),“cov(varlist)”用来指定倾向得分的协变量,“report”表示汇报倾向得分的估计结果,“logit”表示使用logit计算得分,默认选项为probit,“support”表示仅使用共同取值范围内的观测值进行匹配,“test”表示检验倾向得分匹配之后的,各变量在实验组和控制在分布是否平衡。
演示
***PSM_DID
ssc install diff
help diff
***双重差分语法格式***
diff outcome_var ,treat(varname) period(varame) id(varname) ///
kernel ktype(kernel) cov(varlist) report logit support test
use cardkrueger1994.dta
bro
des
sum
diff fte ,t(treated) p(t) kernel id(id) logit cov(bk kfc roys) ///
report support
diff fte ,t(treated) p(t) kernel id(id) logit cov(bk kfc roys) ///
report support test