RDD:断点回归可以加入控制变量吗?
🍎 连享会主页:lianxh.cn
New!
lianxh
命令发布了: GIF 动图介绍
随时搜索 Stata 推文、教程、手册、论坛,安装命令如下:
. ssc install lianxh
连享会 · 最受欢迎的课
🍓 2021 Stata 寒假班
⌚ 2021 年 1.25-2.4🌲 主讲:连玉君 (中山大学);江艇 (中国人民大学)
👉 课程主页:https://gitee.com/arlionn/PX
作者:谭睿鹏 (南京大学)
邮箱:rptan@nju.edu.cn
编者按:本文摘译自以下文献,特此致谢!
Source: Calonico S, Cattaneo M D, Farrell M H, et al. Regression discontinuity designs using covariates[J]. Review of Economics and Statistics, 2019, 101(3): 442-451. -PDF-
目录
1. 引言
2. 方法优点
3. 实例应用
4. 参考文献
5. 相关推文
温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。
1. 引言
断点回归 (RDD) 由于其依赖的假设较弱,并可以为局部政策效应提供稳健的估计和推断,故被广泛应用于实证研究中。在断点回归中,若使用最小二乘法估计,研究者通常会加入不受政策影响的协变量,如人口统计特征;而使用非参数局部多项式法,研究者大都不考虑协变量,这使得估计量并不总是参数的一致估计。为此,Calonico 等 (2019) 将协变量纳入非参数多项式回归中,以估计局部政策效应,并对相应的统计推断进行了数理论证。
当然,本文的目的是对 Calonico 等 (2019) 方法的具体应用进行介绍。
2. 方法优点
Calonico 等 (2019) 论证了包括协变量以后,非参数多项式回归中估计量的一致性和大样本性质。同时,该方法也具有以下优点:
允许多种形式的协变量进入待估模型,如连续型变量或非连续型变量; 可以使用同样的方法选择关键解释变量和协变量的窗宽; 无需假设协变量进入模型的形式,可以是参数形式,也可以是非参数形式。如果是参数形式,也不需要对函数形式进行假定。
3. 实例应用
接下来,将使用 Calonico 等 (2019) 的方法估计美国 “启智计划” 对儿童死亡率的影响 (Ludwig 和 Miller,2007)。“启智计划” 是美国联邦政府为贫困家庭设立的幼儿园资金项目,该政策于 1965 年向美国 300 个最贫困的县提供了援助。作为向贫困宣战的一种策略,“启智计划” 每年为 90 多万名 3 至 5 岁的贫困儿童、及其家庭提供学前教育、健康和其他方面的社会服务。
其中,实施对象的选择是根据 1960 年的美国县级贫困指数,当该指数在 59.1984 以上时,联邦政府就在该县实施 “启智计划”,反之,则不实施。这里的 59.1984 就是一个很好的断点,学者可以利用该断点设计 RDD,来估计 “启智计划” 的政策效应。
但是,影响儿童死亡率的因素还很多,除 “启智计划” 外,还应包括人口数、黑人比例,城市人口比例,3-5 岁的儿童人口数及占比、14-17 岁的人口数及占比、以及 25 岁以上的人口数及占比。因此,在估计 “启智计划” 对儿童死亡率的影响时,应该控制这些协变量。
在本节,本文将展示标准 RD 和纳入协变量后的 RD 政策效应估计量。需要用到的 Stata 命令为 rdrobust
,安装代码和数据如下:
*命令安装
ssc install rdrobust, replace // 或链接:http://fmwww.bc.edu/repec/bocode/r/
*数据地址
*https://gitee.com/arlionn/data/raw/master/data01/headstart.dta
*https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/LPZLBF
定义全局暂元:
use headstart.dta, clear global y mort_age59_related_postHS // y 为因变量 (儿童死亡率)global x povrate60 // x 为分配变量 (forcing variable), 美国县级 1960 年贫困指数global z census1960_pop census1960_pctsch1417 census1960_pctsch534 /// census1960_pctsch25plus census1960_pop1417 census1960_pop534 /// census1960_pop25plus census1960_pcturban census1960_pctblack // z 为上文提到的协变量
对于 RD 的点估计和偏差估计可以有不同的窗宽,这里分别用 h 和 b 来表示,在实际操作中可以限制 h = b,也可以不加限制。在统计推断时,可以使用 RD 标准的统计推断方法,也可以使用协变量调整的 RD 统计推断方法。因此,又可以分为以下几种情形进行讨论:
情形一:对 h 和 b 间关系不加限制,选择使得未考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,RD 标准统计推断方法如下:
rdrobust $y $x, c(59.1968)
global h = e(h_l)
global b = e(b_l)
global IL = e(ci_r_rb) - e(ci_l_rb)
其中,y 为被解释变量,x 为解释变量,c 括号中为分配变量的值,暂元 h 中存储了 RD 点估计时使用的窗宽,暂元 b 中存储了 RD 偏差估计时使用的窗宽,IL 为 95% 置信区间对应的区间长度。
Sharp RD estimates using local polynomial regression.
Cutoff c = 59.1968| Left of c Right of c Number of obs = 2783-------------------+---------------------- BW type = mserd Number of obs | 2489 294 Kernel = TriangularEff. Number of obs | 234 180 VCE method = NN Order est. (p) | 1 1 Order bias (q) | 2 2 BW est. (h) | 6.809 6.809 BW bias (b) | 10.724 10.724 rho (h/b) | 0.635 0.635
Outcome: mort_age59_related_postHS. Running variable: povrate60.-------------------------------------------------------------------------- Method | Coef. Std. Err. z P>|z| [95% Conf. Interval]-------------+------------------------------------------------------------Conventional | -2.4102 1.2053 -1.9996 0.046 -4.77264 -.047753 Robust | - - -2.0340 0.042 -5.46284 -.10125--------------------------------------------------------------------------
可以看出,此时政策效应大小为 -2.41,p 值为 0.042,h 值为 6.809,b 值为 10.724,稳健性 95% 置信区间为 。
情形二:对 h 和 b 间关系不加限制,选择使得未考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,协变量调整的 RD 统计推断方法如下:
rdrobust $y $x, c(59.1968) covs($z) h($h) b($b)
h 为情形一中计算 RD 点估计时使用的窗宽,b 为情形一计算 RD 偏差估计时使用的窗宽。h($h)
和 b($b)
这两个选项很重要,只有加了它们,才能保证情形二是在情形一的基础上进行的计算,并且使用了协变量调整的 RD 统计推断方法。
Covariate-adjusted sharp RD estimates using local polynomial regression.
Cutoff c = 59.1968| Left of c Right of c Number of obs = 2779-------------------+---------------------- BW type = Manual Number of obs | 2485 294 Kernel = TriangularEff. Number of obs | 234 180 VCE method = NN Order est. (p) | 1 1 Order bias (q) | 2 2 BW est. (h) | 6.809 6.809 BW bias (b) | 10.724 10.724 rho (h/b) | 0.635 0.635
Outcome: mort_age59_related_postHS. Running variable: povrate60.-------------------------------------------------------------------------- Method | Coef. Std. Err. z P>|z| [95% Conf. Interval]-------------+------------------------------------------------------------Conventional | -2.5073 1.0973 -2.2849 0.022 -4.65808 -.356569 Robust | - - -2.3160 0.021 -5.36613 -.446789--------------------------------------------------------------------------Covariate-adjusted estimates. Additional covariates included: 9
此时,政策效应大小为 -2.51,p 值为 0.022,h 值为 6.809,b 值为 10.724,稳健性 95% 置信区间为 。
情形三:对 h 和 b 间关系不加限制,选择使得考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,协变量调整的 RD 统计推断方法如下:
rdrobust $y $x, c(59.1968) covs($z)
Covariate-adjusted sharp RD estimates using local polynomial regression.
Cutoff c = 59.1968| Left of c Right of c Number of obs = 2779-------------------+---------------------- BW type = mserd Number of obs | 2485 294 Kernel = TriangularEff. Number of obs | 240 184 VCE method = NN Order est. (p) | 1 1 Order bias (q) | 2 2 BW est. (h) | 6.977 6.977 BW bias (b) | 11.636 11.636 rho (h/b) | 0.600 0.600
Outcome: mort_age59_related_postHS. Running variable: povrate60.-------------------------------------------------------------------------- Method | Coef. Std. Err. z P>|z| [95% Conf. Interval]-------------+------------------------------------------------------------Conventional | -2.4746 1.0888 -2.2729 0.023 -4.60858 -.340674 Robust | - - -2.2586 0.024 -5.20688 -.368638--------------------------------------------------------------------------Covariate-adjusted estimates. Additional covariates included: 9
此时,政策效应大小为 -2.4746,p 值为 0.023,h 值为 6.977,b 值为 11.636,稳健性 95% 置信区间为 。
情形四:限制 h=b,选择使得不考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,同时,不加入协变量,RD 标准统计推断方法如下:
rdrobust $y $x, c(59.1968) rho(1)
global h1 = e(h_l)
global b1 = e(b_l)
其中,rho 括号中写 1,表示限制 h 和 b 相同。
Sharp RD estimates using local polynomial regression.
Cutoff c = 59.1968| Left of c Right of c Number of obs = 2783-------------------+---------------------- BW type = mserd Number of obs | 2489 294 Kernel = TriangularEff. Number of obs | 234 180 VCE method = NN Order est. (p) | 1 1 Order bias (q) | 2 2 BW est. (h) | 6.809 6.809 BW bias (b) | 6.809 6.809 rho (h/b) | 1.000 1.000
Outcome: mort_age59_related_postHS. Running variable: povrate60.-------------------------------------------------------------------------- Method | Coef. Std. Err. z P>|z| [95% Conf. Interval]-------------+------------------------------------------------------------Conventional | -2.4102 1.2053 -1.9996 0.046 -4.77264 -.047753 Robust | - - -2.7627 0.006 -6.41372 -1.09023--------------------------------------------------------------------------
如果不加入协变量,但限制 h=b,政策效应大小的估计值为 -2.4102,p 值为 0.046,b 和 h 值均为 6.809,稳健性 95% 置信区间为 。
情形五:限制 h=b,选择使得不考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,协变量调整的 RD 统计推断方法如下:
rdrobust $y $x, c(59.1968) covs($z) h($h1) b($b1) rho(1)
其中,h 为情形四中计算 RD 点估计时使用的窗宽,b 为情形四计算 RD 偏差估计时使用的窗宽。h($h1)
和 b($b1)
这两个选项很重要,只有加了它们,才能保证情形五是在情形四的基础上进行的计算,并且使用了协变量调整的 RD 统计推断方法。
Covariate-adjusted sharp RD estimates using local polynomial regression.
Cutoff c = 59.1968| Left of c Right of c Number of obs = 2779-------------------+---------------------- BW type = Manual Number of obs | 2485 294 Kernel = TriangularEff. Number of obs | 234 180 VCE method = NN Order est. (p) | 1 1 Order bias (q) | 2 2 BW est. (h) | 6.809 6.809 BW bias (b) | 6.809 6.809 rho (h/b) | 1.000 1.000
Outcome: mort_age59_related_postHS. Running variable: povrate60.-------------------------------------------------------------------------- Method | Coef. Std. Err. z P>|z| [95% Conf. Interval]-------------+------------------------------------------------------------Conventional | -2.5073 1.0973 -2.2849 0.022 -4.65808 -.356569 Robust | - - -3.0701 0.002 -6.63546 -1.46441--------------------------------------------------------------------------Covariate-adjusted estimates. Additional covariates included: 9
在限制 h=b 后,政策效应大小的估计值为 -2.5073,p 值为 0.022,b 和 h 值均为 6.809,稳健性 95% 置信区间为 。
情形六:限制 h=b,选择使得考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,协变量调整的 RD 统计推断方法如下:
rdrobust $y $x, c(59.1968) covs($z) rho(1)
Covariate-adjusted sharp RD estimates using local polynomial regression.
Cutoff c = 59.1968| Left of c Right of c Number of obs = 2779-------------------+---------------------- BW type = mserd Number of obs | 2485 294 Kernel = TriangularEff. Number of obs | 240 184 VCE method = NN Order est. (p) | 1 1 Order bias (q) | 2 2 BW est. (h) | 6.977 6.977 BW bias (b) | 6.977 6.977 rho (h/b) | 1.000 1.000
Outcome: mort_age59_related_postHS. Running variable: povrate60.-------------------------------------------------------------------------- Method | Coef. Std. Err. z P>|z| [95% Conf. Interval]-------------+------------------------------------------------------------Conventional | -2.4746 1.0888 -2.2729 0.023 -4.60858 -.340674 Robust | - - -3.0182 0.003 -6.5421 -1.39074--------------------------------------------------------------------------Covariate-adjusted estimates. Additional covariates included: 9
此时,政策效应大小的估计值为 -2.4746,p 值为 0.023,b 和 h 值均为 6.977,稳健性 95% 置信区间为 。
4. 参考文献
温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。
Calonico S, Cattaneo M D, Farrell M H, et al. Regression discontinuity designs using covariates[J]. Review of Economics and Statistics, 2019, 101(3): 442-451. -PDF- Ludwig J, Miller D L. Does Head Start improve children's life chances? Evidence from a regression discontinuity design[J]. The Quarterly journal of economics, 2007, 122(1): 159-208. -PDF-
5. 相关推文
Note: 产生如下推文列表的命令为:
lianxh RDD, m
安装最新版lianxh
命令:
ssc install lianxh, replace