PSM-DID的经典方法与野路子(一)

高级计量经济学及Stata现场班

陈强  亲授

北京, 2021年5月1-5日

Now or Never!

(详情点击页底“阅读原文”)


上期推文提及,针对横截面数据(cross-sectional data),一般不宜在倾向得分匹配(PSM)之后,再进行OLS回归,因为不仅无必要,而且可能有害:

但凡事皆有例外。一个重要例外则为在面板数据(panel data)中,日益流行的“倾向得分匹配双重差分法”(Propensity Score Matching Difference in Differences,简记PSM-DID)。

PSM-DID最早为Heckman et al. (1997, 1998)提出,给出了严格的识别条件与理论证明,本文称为“经典的PSM-DID方法”。

然而,Heckman et al. (1997, 1998)发表于Review of Economic Studies,对于一般的实证研究者而言过于艰深,而且仅针对两期面板(政策冲击前后各一期)。

由于多期面板也十分常见,故实证研究者在应用中自行“发明”了一些其他的PSM-DID方法。这些探索性的PSM-DID方法不一而足,在某种意义上相当于“野路子”(土办法),目前均尚无严格的理论证明。

本推文将首先介绍经典的PSM-DID方法,不仅因为这是最原创的PSM-DID方法,也因为它有理论上的保证。然后,也将探讨若干PSM-DID“野路子”的优缺点。

需要指出,“野路子”未必就不对,也可能是计量实践领先于计量理论,只是尚无理论上的保证而言(故“野路子”在本文中不含贬义)。

由于PSM本质上针对横截面数据,而DID与PSM-DID均针对面板数据,故PSM-DID实质上还是一种DID方法,只不过借用PSM来构造合适的控制组个体而已。因此,我们首先从DID讲起。

双重差分法(DID)

“双重差分法”(Difference in Differences,简记DID)的核心假设为“平行趋势假设”(parallel trend assumption),也称为“共同趋势假设”(common trend assumption)。

平行趋势假设意味着,若“处理组”(treatment group)未受到政策冲击,其平均时间趋势与“控制组”(control group)相同或平行,参见下图。

更精确地,可用下式来表述平行趋势假设:

其中,左边“

”表示个体 i 属于处理组,而右边“

”则表示个体 i  属于控制组。

下标 t  表示第 期,而下标 ' 表示在此之前的一期,即 ' = t - 1。

结果变量

括号中的“0”表示,这是未受政策冲击的“潜在结果”(potential outcome)。

不难看出,在平行趋势假设下,可以使用控制组个体的平均变化趋势,作为处理组个体如果未受政策冲击的反事实的平均变化趋势。这正是DID的核心思想。

在具体操作上,对于两期面板,DID可通过“双重差分”来实现;但对于多期面板,则更方便使用面板数据的“双向固定效应模型”(two-way fixed effects model)来实现,详见本公众号的往期推文:

开学礼包:如何使用双重差分法的交叉项(迄今最全攻略)

最新AER论文速递(含Stata操作):异质性处理效应下的双向固定效应估计量

然而,在实践中,平行趋势假设并不容易满足。原因有二。首先,处理组与控制组分别包含了许多不同的个体。

其次,进入处理组与控制组的个体可能存在系统差别,即所谓“选择偏差”(selection bias);比如,著名的“阿森费尔特沉降”(Ashenfelter's dip),即最近收入下降者更倾向于参加就业培训项目。

如果平行趋势假设不满足,则无法使用DID来识别政策冲击的因果效应。此时,可考虑使用PSM-DID,因为PSM-DID的“条件平行趋势假设”更容易满足。

倾向得分匹配双重差分法(PSM-DID)的假设

传统DID的平行趋势假设并未考虑处理组与控制组的协变量差异(协变量未出现于上述公式中),故此假定不容易满足(协变量可能在两组之间很不平衡)。

显然,如果给定相同的协变量,则处理组与控制组的个体更容易拥有相同的时间趋势。这正是PSM-DID最核心的“条件平行趋势假设”(conditional parallel trend assumption)。

假设数据为两期面板,“条件平行趋势假设”可用公式表达如下:

其中,

为个体 i  的所有协变量所构成的向量;下标 表示处理后(post-treatment),而下标 ' 表示处理前(pre-treatment)。

对比以上两个公式可看出,二者的区别仅在于,是否在给定协变量

的条件下求条件期望。Heckman et al. (1997, 1998)将此假设称为“双重差分均值独立”(differences in differences mean independence),但本质上,它是在给定

条件下的平行趋势假设。

显然,“条件平行趋势假设”比传统的“平行趋势假设”更容易满足,因为毕竟前者要求处理组与控制组个体的协变量完全相同(相当于找到特征完全相同或接近的替身)。

然而,“条件平行趋势假设”也更难检验,因为需要针对样本中不同的

进行检验;而一旦给定

后,样本容量可能就非常有限了。

进一步,对于PSM-DID,进行传统的平行趋势检验将没有意义,因为PSM-DID并不依赖于传统的平行趋势假设。

经典PSM-DID的估计方法

在两期面板中,基于条件平行趋势假设,PSM-DID的基本做法是:首先使用处理前的第1期数据(这是横截面数据),进行倾向得分匹配(PSM);然后根据匹配结果,针对两期面板进行双重差分估计(这是真正意义上的双重差分,当然也可使用OLS)。

在具体匹配方法上,可以使用传统的“K近邻匹配”(k-nearest neighbor matching),“卡尺内匹配”(caliper matching)或“卡尺内K近邻匹配”(k-nearest neighbor matching within caliper)。

然而,近邻匹配虽易理解,但所得结果可能依赖于K(匹配的邻居个数);而通常K=1的最近邻匹配并非最优选择,因为方差较大。另一方面,若进行卡尺内匹配,也不易选择卡尺的半径。

为此,Heckman et al. (1997, 1998)主要使用“核匹配”(kernel matching)进行PSM-DID。所谓“核匹配”,是一种“全局匹配”(global matching)方法,即将处理组的每位个体与控制组的所有个体进行匹配,但控制组每位个体的权重(weights)不尽相同;而这些权重则通过使用“核函数”(kernel functions),根据“倾向得分”(propensity scores)计算而得。比如,若控制组某位个体的倾向得分,与所考虑的处理组个体之倾向得分相去甚远,则该控制组个体的权重将很小,甚至为0。

更具体地,在两期面板中,经典PSM-DID的步骤包括:

第1步、使用处理前的第1期数据,通过 Logit 或 Probit 回归,根据处理变量

与协变量

估计倾向得分

(即 PSM)。

第2步、对于处理组的每位个体 i,计算其结果变量的前后变化

第3步、对于控制组的每位个体 j,计算其结果变量的前后变化

第4步、使用以下公式计算PSM-DID估计量,作为对于“处理组的平均处理效应”(Average Treatment Effect on the Treated,简记 ATT)的一致估计:

其中,

为处理组的个体数目,而

为处理组个体 i 与控制组个体 这一配对的权重,其计算公式为

其中,

为核函数(比如三角核、二次核或高斯核),而 h 为带宽(bandwidth)。根据非参数估计知识,所得结果对于具体的核函数并不敏感,而带宽 h 则可选择最优带宽。

在以上最后一步,也可以使用“加权最小二乘法”(weighted OLS)来进行,并由此得到相应的标准误与 p 值。

经典PSM-DID的小结

综上所述,经典的PSM-DID方法可谓一气呵成。其第一阶段的PSM,只是用于计算DID阶段的权重

而已。

有关经典PSM-DID方法的Stata操作,可通过非官方命令 diff 来实现,详见《高级计量经济学及Stata应用》(陈强,2014,第2版)。

另外,虽然经典PSM-DID方法假设两期面板数据,但事实上也可应用于多期面板,只要每次仅选取两期即可(政策冲击前后更一期)。这样做的好处在于,不仅可作为稳健性检验(robustness checks),还可考察处理效应的动态变化。

当然,在多期面板中,若每次仅使用两期进行经典的PSM-DID估计,则显然影响估计效率。为此,同时使用多期数据进行PSM-DID估计的“野路子”应运而生,在实践中广泛应用(论文发表于中英文期刊),将在下期推文中详细介绍。

参考文献

陈强,《高级计量经济学及Stata应用》,第2版,高等教育出版社,2014年

陈强,《计量经济学及Stata应用》,高等教育出版社,2015年(好评如潮的配套教学视频,可在Peixun.net 或网易云课堂购买)

陈强,《机器学习及R应用》,高等教育出版社,2020年11月

陈强,《机器学习及Python应用》,高等教育出版社,2021年,即将出版。

(0)

相关推荐