RDD:断点回归可以加入控制变量吗?

🍎 连享会主页:lianxh.cn

New! lianxh 命令发布了:   GIF 动图介绍
随时搜索 Stata 推文、教程、手册、论坛,安装命令如下:
. ssc install lianxh

连享会 · 最受欢迎的课


🍓 2021 Stata 寒假班
⌚ 2021 年 1.25-2.4

🌲 主讲:连玉君 (中山大学);江艇 (中国人民大学)

👉 课程主页https://gitee.com/arlionn/PX

作者:谭睿鹏 (南京大学)
邮箱:rptan@nju.edu.cn

编者按:本文摘译自以下文献,特此致谢!

Source: Calonico S, Cattaneo M D, Farrell M H, et al. Regression discontinuity designs using covariates[J]. Review of Economics and Statistics, 2019, 101(3): 442-451. -PDF-


目录

  • 1. 引言

  • 2. 方法优点

  • 3. 实例应用

  • 4. 参考文献

  • 5. 相关推文


温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。

1. 引言

断点回归 (RDD) 由于其依赖的假设较弱,并可以为局部政策效应提供稳健的估计和推断,故被广泛应用于实证研究中。在断点回归中,若使用最小二乘法估计,研究者通常会加入不受政策影响的协变量,如人口统计特征;而使用非参数局部多项式法,研究者大都不考虑协变量,这使得估计量并不总是参数的一致估计。为此,Calonico 等 (2019) 将协变量纳入非参数多项式回归中,以估计局部政策效应,并对相应的统计推断进行了数理论证。

当然,本文的目的是对 Calonico 等 (2019) 方法的具体应用进行介绍。

2. 方法优点

Calonico 等 (2019) 论证了包括协变量以后,非参数多项式回归中估计量的一致性和大样本性质。同时,该方法也具有以下优点:

  • 允许多种形式的协变量进入待估模型,如连续型变量或非连续型变量;
  • 可以使用同样的方法选择关键解释变量和协变量的窗宽;
  • 无需假设协变量进入模型的形式,可以是参数形式,也可以是非参数形式。如果是参数形式,也不需要对函数形式进行假定。

3. 实例应用

接下来,将使用 Calonico 等 (2019) 的方法估计美国 “启智计划” 对儿童死亡率的影响 (Ludwig 和 Miller,2007)。“启智计划” 是美国联邦政府为贫困家庭设立的幼儿园资金项目,该政策于 1965 年向美国 300 个最贫困的县提供了援助。作为向贫困宣战的一种策略,“启智计划” 每年为 90 多万名 3 至 5 岁的贫困儿童、及其家庭提供学前教育、健康和其他方面的社会服务。

其中,实施对象的选择是根据 1960 年的美国县级贫困指数,当该指数在 59.1984 以上时,联邦政府就在该县实施 “启智计划”,反之,则不实施。这里的 59.1984 就是一个很好的断点,学者可以利用该断点设计 RDD,来估计 “启智计划” 的政策效应。

但是,影响儿童死亡率的因素还很多,除 “启智计划” 外,还应包括人口数、黑人比例,城市人口比例,3-5 岁的儿童人口数及占比、14-17 岁的人口数及占比、以及 25 岁以上的人口数及占比。因此,在估计 “启智计划” 对儿童死亡率的影响时,应该控制这些协变量。

在本节,本文将展示标准 RD 和纳入协变量后的 RD 政策效应估计量。需要用到的 Stata 命令为 rdrobust,安装代码和数据如下:

*命令安装
ssc install rdrobust, replace // 或链接:http://fmwww.bc.edu/repec/bocode/r/

*数据地址
*https://gitee.com/arlionn/data/raw/master/data01/headstart.dta
*https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/LPZLBF

定义全局暂元:

use headstart.dta, clear global y mort_age59_related_postHS  // y 为因变量 (儿童死亡率)global x povrate60                  // x 为分配变量 (forcing variable), 美国县级 1960 年贫困指数global z census1960_pop census1960_pctsch1417 census1960_pctsch534    ///         census1960_pctsch25plus census1960_pop1417 census1960_pop534 ///         census1960_pop25plus census1960_pcturban census1960_pctblack // z 为上文提到的协变量

对于 RD 的点估计和偏差估计可以有不同的窗宽,这里分别用 h 和 b 来表示,在实际操作中可以限制 h = b,也可以不加限制。在统计推断时,可以使用 RD 标准的统计推断方法,也可以使用协变量调整的 RD 统计推断方法。因此,又可以分为以下几种情形进行讨论:

情形一:对 h 和 b 间关系不加限制,选择使得未考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,RD 标准统计推断方法如下:

rdrobust $y $x, c(59.1968)
global h = e(h_l)
global b = e(b_l)
global IL = e(ci_r_rb) - e(ci_l_rb)

其中,y 为被解释变量,x 为解释变量,c 括号中为分配变量的值,暂元 h 中存储了 RD 点估计时使用的窗宽,暂元 b 中存储了 RD 偏差估计时使用的窗宽,IL 为 95% 置信区间对应的区间长度。

Sharp RD estimates using local polynomial regression.

 Cutoff c = 59.1968| Left of c Right of c       Number of obs =       2783-------------------+----------------------      BW type       =      mserd     Number of obs |      2489         294      Kernel        = TriangularEff. Number of obs |       234         180      VCE method    =         NN    Order est. (p) |         1           1    Order bias (q) |         2           2       BW est. (h) |     6.809       6.809       BW bias (b) |    10.724      10.724         rho (h/b) |     0.635       0.635

Outcome: mort_age59_related_postHS. Running variable: povrate60.--------------------------------------------------------------------------      Method |   Coef.    Std. Err.    z     P>|z|    [95% Conf. Interval]-------------+------------------------------------------------------------Conventional | -2.4102     1.2053   -1.9996  0.046   -4.77264     -.047753      Robust |     -          -     -2.0340  0.042   -5.46284      -.10125--------------------------------------------------------------------------

可以看出,此时政策效应大小为 -2.41,p 值为 0.042,h 值为 6.809,b 值为 10.724,稳健性 95% 置信区间为 。

情形二:对 h 和 b 间关系不加限制,选择使得未考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,协变量调整的 RD 统计推断方法如下:

rdrobust $y $x, c(59.1968) covs($z) h($h) b($b)

h 为情形一中计算 RD 点估计时使用的窗宽,b 为情形一计算 RD 偏差估计时使用的窗宽。h($h)b($b) 这两个选项很重要,只有加了它们,才能保证情形二是在情形一的基础上进行的计算,并且使用了协变量调整的 RD 统计推断方法。

Covariate-adjusted sharp RD estimates using local polynomial regression.

 Cutoff c = 59.1968| Left of c Right of c       Number of obs =       2779-------------------+----------------------      BW type       =     Manual     Number of obs |      2485         294      Kernel        = TriangularEff. Number of obs |       234         180      VCE method    =         NN    Order est. (p) |         1           1    Order bias (q) |         2           2       BW est. (h) |     6.809       6.809       BW bias (b) |    10.724      10.724         rho (h/b) |     0.635       0.635

Outcome: mort_age59_related_postHS. Running variable: povrate60.--------------------------------------------------------------------------      Method |   Coef.    Std. Err.    z     P>|z|    [95% Conf. Interval]-------------+------------------------------------------------------------Conventional | -2.5073     1.0973   -2.2849  0.022   -4.65808     -.356569      Robust |     -          -     -2.3160  0.021   -5.36613     -.446789--------------------------------------------------------------------------Covariate-adjusted estimates. Additional covariates included: 9

此时,政策效应大小为 -2.51,p 值为 0.022,h 值为 6.809,b 值为 10.724,稳健性 95% 置信区间为 。

情形三:对 h 和 b 间关系不加限制,选择使得考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,协变量调整的 RD 统计推断方法如下:

rdrobust $y $x, c(59.1968) covs($z)
Covariate-adjusted sharp RD estimates using local polynomial regression.

 Cutoff c = 59.1968| Left of c Right of c       Number of obs =       2779-------------------+----------------------      BW type       =      mserd     Number of obs |      2485         294      Kernel        = TriangularEff. Number of obs |       240         184      VCE method    =         NN    Order est. (p) |         1           1    Order bias (q) |         2           2       BW est. (h) |     6.977       6.977       BW bias (b) |    11.636      11.636         rho (h/b) |     0.600       0.600

Outcome: mort_age59_related_postHS. Running variable: povrate60.--------------------------------------------------------------------------      Method |   Coef.    Std. Err.    z     P>|z|    [95% Conf. Interval]-------------+------------------------------------------------------------Conventional | -2.4746     1.0888   -2.2729  0.023   -4.60858     -.340674      Robust |     -          -     -2.2586  0.024   -5.20688     -.368638--------------------------------------------------------------------------Covariate-adjusted estimates. Additional covariates included: 9

此时,政策效应大小为 -2.4746,p 值为 0.023,h 值为 6.977,b 值为 11.636,稳健性 95% 置信区间为 。

情形四:限制 h=b,选择使得不考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,同时,不加入协变量,RD 标准统计推断方法如下:

rdrobust $y $x, c(59.1968) rho(1)
global h1 = e(h_l)
global b1 = e(b_l)

其中,rho 括号中写 1,表示限制 h 和 b 相同。

Sharp RD estimates using local polynomial regression.

 Cutoff c = 59.1968| Left of c Right of c       Number of obs =       2783-------------------+----------------------      BW type       =      mserd     Number of obs |      2489         294      Kernel        = TriangularEff. Number of obs |       234         180      VCE method    =         NN    Order est. (p) |         1           1    Order bias (q) |         2           2       BW est. (h) |     6.809       6.809       BW bias (b) |     6.809       6.809         rho (h/b) |     1.000       1.000

Outcome: mort_age59_related_postHS. Running variable: povrate60.--------------------------------------------------------------------------      Method |   Coef.    Std. Err.    z     P>|z|    [95% Conf. Interval]-------------+------------------------------------------------------------Conventional | -2.4102     1.2053   -1.9996  0.046   -4.77264     -.047753      Robust |     -          -     -2.7627  0.006   -6.41372     -1.09023--------------------------------------------------------------------------

如果不加入协变量,但限制 h=b,政策效应大小的估计值为 -2.4102,p 值为 0.046,b 和 h 值均为 6.809,稳健性 95% 置信区间为 。

情形五:限制 h=b,选择使得不考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,协变量调整的 RD 统计推断方法如下:

rdrobust $y $x, c(59.1968) covs($z) h($h1) b($b1) rho(1)

其中,h 为情形四中计算 RD 点估计时使用的窗宽,b 为情形四计算 RD 偏差估计时使用的窗宽。h($h1)b($b1) 这两个选项很重要,只有加了它们,才能保证情形五是在情形四的基础上进行的计算,并且使用了协变量调整的 RD 统计推断方法。

Covariate-adjusted sharp RD estimates using local polynomial regression.

 Cutoff c = 59.1968| Left of c Right of c       Number of obs =       2779-------------------+----------------------      BW type       =     Manual     Number of obs |      2485         294      Kernel        = TriangularEff. Number of obs |       234         180      VCE method    =         NN    Order est. (p) |         1           1    Order bias (q) |         2           2       BW est. (h) |     6.809       6.809       BW bias (b) |     6.809       6.809         rho (h/b) |     1.000       1.000

Outcome: mort_age59_related_postHS. Running variable: povrate60.--------------------------------------------------------------------------      Method |   Coef.    Std. Err.    z     P>|z|    [95% Conf. Interval]-------------+------------------------------------------------------------Conventional | -2.5073     1.0973   -2.2849  0.022   -4.65808     -.356569      Robust |     -          -     -3.0701  0.002   -6.63546     -1.46441--------------------------------------------------------------------------Covariate-adjusted estimates. Additional covariates included: 9

在限制 h=b 后,政策效应大小的估计值为 -2.5073,p 值为 0.022,b 和 h 值均为 6.809,稳健性 95% 置信区间为 。

情形六:限制 h=b,选择使得考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,协变量调整的 RD 统计推断方法如下:

rdrobust $y $x, c(59.1968) covs($z) rho(1)
Covariate-adjusted sharp RD estimates using local polynomial regression.

 Cutoff c = 59.1968| Left of c Right of c       Number of obs =       2779-------------------+----------------------      BW type       =      mserd     Number of obs |      2485         294      Kernel        = TriangularEff. Number of obs |       240         184      VCE method    =         NN    Order est. (p) |         1           1    Order bias (q) |         2           2       BW est. (h) |     6.977       6.977       BW bias (b) |     6.977       6.977         rho (h/b) |     1.000       1.000

Outcome: mort_age59_related_postHS. Running variable: povrate60.--------------------------------------------------------------------------      Method |   Coef.    Std. Err.    z     P>|z|    [95% Conf. Interval]-------------+------------------------------------------------------------Conventional | -2.4746     1.0888   -2.2729  0.023   -4.60858     -.340674      Robust |     -          -     -3.0182  0.003    -6.5421     -1.39074--------------------------------------------------------------------------Covariate-adjusted estimates. Additional covariates included: 9

此时,政策效应大小的估计值为 -2.4746,p 值为 0.023,b 和 h 值均为 6.977,稳健性 95% 置信区间为 。

4. 参考文献

温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。

  • Calonico S, Cattaneo M D, Farrell M H, et al. Regression discontinuity designs using covariates[J]. Review of Economics and Statistics, 2019, 101(3): 442-451. -PDF-
  • Ludwig J, Miller D L. Does Head Start improve children's life chances? Evidence from a regression discontinuity design[J]. The Quarterly journal of economics, 2007, 122(1): 159-208. -PDF-

5. 相关推文

Note: 产生如下推文列表的命令为:
lianxh RDD, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

(0)

相关推荐