PSM-DID的经典方法与野路子(一)
高级计量经济学及Stata现场班
陈强 亲授
北京, 2021年5月1-5日
Now or Never!
(详情点击页底“阅读原文”)
上期推文提及,针对横截面数据(cross-sectional data),一般不宜在倾向得分匹配(PSM)之后,再进行OLS回归,因为不仅无必要,而且可能有害:
但凡事皆有例外。一个重要例外则为在面板数据(panel data)中,日益流行的“倾向得分匹配双重差分法”(Propensity Score Matching Difference in Differences,简记PSM-DID)。
PSM-DID最早为Heckman et al. (1997, 1998)提出,给出了严格的识别条件与理论证明,本文称为“经典的PSM-DID方法”。
然而,Heckman et al. (1997, 1998)发表于Review of Economic Studies,对于一般的实证研究者而言过于艰深,而且仅针对两期面板(政策冲击前后各一期)。
由于多期面板也十分常见,故实证研究者在应用中自行“发明”了一些其他的PSM-DID方法。这些探索性的PSM-DID方法不一而足,在某种意义上相当于“野路子”(土办法),目前均尚无严格的理论证明。
本推文将首先介绍经典的PSM-DID方法,不仅因为这是最原创的PSM-DID方法,也因为它有理论上的保证。然后,也将探讨若干PSM-DID“野路子”的优缺点。
需要指出,“野路子”未必就不对,也可能是计量实践领先于计量理论,只是尚无理论上的保证而言(故“野路子”在本文中不含贬义)。
由于PSM本质上针对横截面数据,而DID与PSM-DID均针对面板数据,故PSM-DID实质上还是一种DID方法,只不过借用PSM来构造合适的控制组个体而已。因此,我们首先从DID讲起。
双重差分法(DID)
“双重差分法”(Difference in Differences,简记DID)的核心假设为“平行趋势假设”(parallel trend assumption),也称为“共同趋势假设”(common trend assumption)。
平行趋势假设意味着,若“处理组”(treatment group)未受到政策冲击,其平均时间趋势与“控制组”(control group)相同或平行,参见下图。
更精确地,可用下式来表述平行趋势假设:
其中,左边“
”表示个体 i 属于处理组,而右边“
”则表示个体 i 属于控制组。
下标 t 表示第 t 期,而下标 t ' 表示在此之前的一期,即 t ' = t - 1。
结果变量
括号中的“0”表示,这是未受政策冲击的“潜在结果”(potential outcome)。
不难看出,在平行趋势假设下,可以使用控制组个体的平均变化趋势,作为处理组个体如果未受政策冲击的反事实的平均变化趋势。这正是DID的核心思想。
在具体操作上,对于两期面板,DID可通过“双重差分”来实现;但对于多期面板,则更方便使用面板数据的“双向固定效应模型”(two-way fixed effects model)来实现,详见本公众号的往期推文:
最新AER论文速递(含Stata操作):异质性处理效应下的双向固定效应估计量
然而,在实践中,平行趋势假设并不容易满足。原因有二。首先,处理组与控制组分别包含了许多不同的个体。
其次,进入处理组与控制组的个体可能存在系统差别,即所谓“选择偏差”(selection bias);比如,著名的“阿森费尔特沉降”(Ashenfelter's dip),即最近收入下降者更倾向于参加就业培训项目。
如果平行趋势假设不满足,则无法使用DID来识别政策冲击的因果效应。此时,可考虑使用PSM-DID,因为PSM-DID的“条件平行趋势假设”更容易满足。
倾向得分匹配双重差分法(PSM-DID)的假设
传统DID的平行趋势假设并未考虑处理组与控制组的协变量差异(协变量未出现于上述公式中),故此假定不容易满足(协变量可能在两组之间很不平衡)。
显然,如果给定相同的协变量,则处理组与控制组的个体更容易拥有相同的时间趋势。这正是PSM-DID最核心的“条件平行趋势假设”(conditional parallel trend assumption)。
假设数据为两期面板,“条件平行趋势假设”可用公式表达如下:
其中,
为个体 i 的所有协变量所构成的向量;下标 t 表示处理后(post-treatment),而下标 t ' 表示处理前(pre-treatment)。
对比以上两个公式可看出,二者的区别仅在于,是否在给定协变量
的条件下求条件期望。Heckman et al. (1997, 1998)将此假设称为“双重差分均值独立”(differences in differences mean independence),但本质上,它是在给定
条件下的平行趋势假设。
显然,“条件平行趋势假设”比传统的“平行趋势假设”更容易满足,因为毕竟前者要求处理组与控制组个体的协变量完全相同(相当于找到特征完全相同或接近的替身)。
然而,“条件平行趋势假设”也更难检验,因为需要针对样本中不同的
进行检验;而一旦给定
后,样本容量可能就非常有限了。
进一步,对于PSM-DID,进行传统的平行趋势检验将没有意义,因为PSM-DID并不依赖于传统的平行趋势假设。
经典PSM-DID的估计方法
在两期面板中,基于条件平行趋势假设,PSM-DID的基本做法是:首先使用处理前的第1期数据(这是横截面数据),进行倾向得分匹配(PSM);然后根据匹配结果,针对两期面板进行双重差分估计(这是真正意义上的双重差分,当然也可使用OLS)。
在具体匹配方法上,可以使用传统的“K近邻匹配”(k-nearest neighbor matching),“卡尺内匹配”(caliper matching)或“卡尺内K近邻匹配”(k-nearest neighbor matching within caliper)。
然而,近邻匹配虽易理解,但所得结果可能依赖于K(匹配的邻居个数);而通常K=1的最近邻匹配并非最优选择,因为方差较大。另一方面,若进行卡尺内匹配,也不易选择卡尺的半径。
为此,Heckman et al. (1997, 1998)主要使用“核匹配”(kernel matching)进行PSM-DID。所谓“核匹配”,是一种“全局匹配”(global matching)方法,即将处理组的每位个体与控制组的所有个体进行匹配,但控制组每位个体的权重(weights)不尽相同;而这些权重则通过使用“核函数”(kernel functions),根据“倾向得分”(propensity scores)计算而得。比如,若控制组某位个体的倾向得分,与所考虑的处理组个体之倾向得分相去甚远,则该控制组个体的权重将很小,甚至为0。
更具体地,在两期面板中,经典PSM-DID的步骤包括:
第1步、使用处理前的第1期数据,通过 Logit 或 Probit 回归,根据处理变量
与协变量
估计倾向得分
(即 PSM)。
第2步、对于处理组的每位个体 i,计算其结果变量的前后变化
。
第3步、对于控制组的每位个体 j,计算其结果变量的前后变化
。
第4步、使用以下公式计算PSM-DID估计量,作为对于“处理组的平均处理效应”(Average Treatment Effect on the Treated,简记 ATT)的一致估计:
其中,
为处理组的个体数目,而
为处理组个体 i 与控制组个体 j 这一配对的权重,其计算公式为
其中,
为核函数(比如三角核、二次核或高斯核),而 h 为带宽(bandwidth)。根据非参数估计知识,所得结果对于具体的核函数并不敏感,而带宽 h 则可选择最优带宽。
在以上最后一步,也可以使用“加权最小二乘法”(weighted OLS)来进行,并由此得到相应的标准误与 p 值。
经典PSM-DID的小结
综上所述,经典的PSM-DID方法可谓一气呵成。其第一阶段的PSM,只是用于计算DID阶段的权重
而已。
有关经典PSM-DID方法的Stata操作,可通过非官方命令 diff 来实现,详见《高级计量经济学及Stata应用》(陈强,2014,第2版)。
另外,虽然经典PSM-DID方法假设两期面板数据,但事实上也可应用于多期面板,只要每次仅选取两期即可(政策冲击前后更一期)。这样做的好处在于,不仅可作为稳健性检验(robustness checks),还可考察处理效应的动态变化。
当然,在多期面板中,若每次仅使用两期进行经典的PSM-DID估计,则显然影响估计效率。为此,同时使用多期数据进行PSM-DID估计的“野路子”应运而生,在实践中广泛应用(论文发表于中英文期刊),将在下期推文中详细介绍。
参考文献
陈强,《高级计量经济学及Stata应用》,第2版,高等教育出版社,2014年
陈强,《计量经济学及Stata应用》,高等教育出版社,2015年(好评如潮的配套教学视频,可在Peixun.net 或网易云课堂购买)
陈强,《机器学习及R应用》,高等教育出版社,2020年11月
陈强,《机器学习及Python应用》,高等教育出版社,2021年,即将出版。