Stata：非对称固定效应模型 / 开普饭

实现经济增长的途径主要有两个：一是增加投入，二是提高效率。后者不仅能增加经济总量，还能提升经济质量。因此，效率分析是经济学研究中的核心。

显然，若想发表高水平的论文，就必须能自主编程，以便实现最新方法，走在前列、引领趋势，这正是本期「效率分析编程进阶班」课程的主旨。

张宁教授在环境效率和非期望产出领域学者中排名第二，他在 Science, Nature, Cell 和 Lancet 上均有发表。杜克锐副教授已在 SSC 发布了十余个 Stata 命令，有三篇论文发表于 Stata Journal，获得 2020 年 Stata 中国用户奖。

课程包括参数方法和非参数方法两个部分：

参数方法主要包括参数线性规划（Parametric LP）、计量经济方法和随机前沿方法（SFA）三大方法。

非参数方法，即 DEA 方法，主要包括 DDF, NDDF 和 SBM 等模型。

课程亮点 在于如何从程序员角度设计模型，深刻理解理论及其编程和代码实现，旨在使研究者能够得心应手的实现最新模型、开发自己的模型。

扫码直达课程主页：

编者：展一帆 (复旦大学)
E-Mail: simonzhanyf@163.com

编者注： 本文翻译改编自 Paul Allison 教授发表的论文以及博客文章，特此致谢。Source: Allison P D . Asymmetric Fixed-effects Models for Panel Data[J]. Socius: Sociological Research for a Dynamic World, 2019

1. 问题背景
2. 案例分析
3. 多期非对称固定效应模型
4. 参考文献
5. 附：全文 dofiles

温馨提示： 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码，直达原文：

1. 问题背景

标准的面板数据分析方法依赖于方向对称性假设（directional symmetry）。具体而言，即如果变量增加一个单位导致变动个单位，那么变量减少一个单位也将导致减少个单位。

但是这种对称性的假设在很多情形下往往不适用。例如，一个人结婚时幸福水平的增加与离婚时幸福水平的减少正好相等么？亦或者收入增加 1 万美元对储蓄的提振与减少 1 万美元的影响正好对称么？

本文将利用一个仅包含双时点的简单情形，展示如何放松这一假设。关于多时期的情形，可以参阅 Allison (2019)。

2. 案例分析

首先可以下载作者 Paul Allison 提供的范例数据 nlsy.dta (右击另存)。该数据集横截面上有 581 名儿童，分别在 1990 年和 1992 年参与了国家青年纵向调查，测量了如下三个指标：

anti ：反社会行为，测度指标为一有序分类变量，取值从 0 至 6。
self ：自尊心，测度指标为一有序分类变量，取值从 6 至 24。
pov ：家庭贫困状况, 测度指标为一虚拟变量，取 1 代表家庭贫困，取 0 则反之。

实证分析的目标是估计 self 和 pov 对 anti 的因果效应。估计模型采用传统的固定效应模型 (Allison 2005, 2009) ，其是研究随时间增加或减少的效应的理想选择，并且可以很好地控制非时变不可观测因素。

对于两个时期的数据，有几种等价的方法可以估计固定效应模型。其中差分法是允许方向不对称的最直接方法。其原理是从时间 2 的值中减去时间 1 的值以构造差分变量，然后只需对差异后的变量执行 OLS 估计即可。

如下是「传统 对称模型」的 Stata 代码：

*-下载数据，保存到当前工作路径下

. copy 'https://statisticalhorizons.com/wp-content/uploads/nlsy.dta' nlsy.dta, replace
. use 'nlsy.dta', clear
*-数据概况
. des

Contains data from nlsy.dta

obs: 581

vars: 16

size: 12,782

----------------------------------------------------
variable name variable label

----------------------------------------------------

momage mother age at birth of child years

anti90 child antisocial behavior in 1990

anti92 child antisocial behavior in 1992

anti94 child antisocial behavior in 1994

gender child's gender

childage child age in 1990 years

hispanic child race hispanic

black child race black

momwork mother employment status in 1990

married mother married in 1990

self90 child self-esteem in 1990

self92 child self-esteem in 1992

self94 child self-esteem in 1994

pov90 family poverty status in 1990

pov92 family poverty status in 1992

pov94

----------------------------------------------------
*-变量的基本统计量

. sum // 下面的结果是用 fsum 命令得到的

Variable | N Mean SD Min Max

----------+---------------------------------------------

momage | 581 20.66 2.19 16.00 25.00

anti90 | 581 1.57 1.47 0.00 6.00

anti92 | 581 1.60 1.56 0.00 6.00

anti94 | 581 1.75 1.69 0.00 6.00

gender | 581 0.50 0.50 0.00 1.00

childage | 581 8.94 0.60 8.00 10.00

hispanic | 581 0.24 0.43 0.00 1.00

black | 581 0.36 0.48 0.00 1.00

momwork | 581 0.34 0.47 0.00 1.00

married | 581 0.24 0.42 0.00 1.00

self90 | 581 20.07 3.19 9.00 24.00

self92 | 581 20.36 3.53 6.00 24.00

self94 | 581 20.62 3.27 9.00 24.00

pov90 | 581 0.34 0.47 0.00 1.00

pov92 | 581 0.33 0.47 0.00 1.00

pov94 | 581 0.32 0.47 0.00 1.00
*-回归分析 I：对称固定效应模型
generate antidiff = anti92 - anti90

generate selfdiff = self92 - self90

generate povdiff = pov92 - pov90

regress antidiff selfdiff povdiff

结果如下 (这里省略了置信区间)：

---------------------------------------------------- antidiff |      Coef.   Std. Err.      t    P>|t|  ----------+----------------------------------------- selfdiff |  -.0391292   .0136396    -2.87   0.004    povdiff |   .1969039   .1326352     1.48   0.138      _cons |   .0403031   .0533833     0.75   0.451  ----------------------------------------------------

从结果来看，自尊对反社会行为具有显著的负面影响。具体而言，自尊每增加 1 个单位，反社会行为就会下降 0.039 个单位。但这也意味着自尊每降低 1 个单位，反社会行为就会增加 0.039 个单位。贫困对自尊产生正向（但不显著）的影响。陷入贫困的儿童的反社会行为增加了 0.196 个单位，而摆脱贫困的儿童的反社会行为则降低了 0.196。

那么进一步，如何放松方向对称性假设（directional symmetry）的约束？参考 York and Light（2017），需要将每个差分后的变量进一步分解为其 正分量 和 负分量 两个部分。设为变量的一阶差分，则正、负分量的定义方法如下：

正分量 ()：如果，则，否则为
负分量 ()：如果，则，否则为

以下是在 Stata 中创建这些变量的方法，其中括号中的不等式是逻辑表达式，如果不等式为 true，则值为 1；如果不等式为 false，则值为 0。

generate selfpos = selfdiff*(selfdiff>0)

generate selfneg = -selfdiff*(selfdiff<0)

generate povpos = povdiff*(povdiff>0)

generate povneg = -povdiff*(povdiff<0)

现在只需用 antidiff 对这个四个变量执行 OLS 回归即可：

regress antidiff selfpos selfneg  povpos povneg

---------------------------------------------------antidiff |      Coef.   Std. Err.      t    P>|t|  ---------+----------------------------------------- selfpos |  -.0048386   .0251504    -0.19   0.848   selfneg |   .0743077    .025658     2.90   0.004    povpos |   .2502064   .2003789     1.25   0.212    povneg |   -.126328   .1923669    -0.66   0.512     _cons |  -.0749517    .086383    -0.87   0.386  ---------------------------------------------------

在放松对称性假设后的回归中，结果发生了显著变化：

自尊心 self 每增加 1 个单位，反社会行为就会降低 0.005 个单位（不显着）；但自尊心下降 1 个单位会使反社会行为增加 0.074 个单位（非常显着）。因此，自尊心对反社会行为的影响是非对称的，其下降会产生很大影响，而自尊心的增长却几乎没有影响。请注意，原始估计值 -0.039 大约介于这两个估计值之间 (可以视为平均效果吗？)。

那么，上述对称效果是否显着不同？我们可以使用以下命令进行检验：

. test selfpos = -selfneg
( 1) selfpos + selfneg = 0
F( 1, 576) = 2.63

Prob > F = 0.1057
. test povpos = -povneg
( 1) povpos + povneg = 0

F( 1, 576) = 0.18 Prob > F = 0.6688

得出的 p 值为 0.10，在统计上不显着。这意味着，本例中，「自尊心效应」并不存在统计上显著的非对称特征。

家庭贫困状态 pov 变量的两个分量的系数虽然都在预期的方向上，但统计上均不显著。陷入贫困会增加反社会行为，而摆脱贫困则会减少反社会行为，但幅度只有一半左右。这两种效果统计上差异也不显著。

以上便是非对称固定效应模型用于分析两期面板数据的实操方法。

3. 多期非对称固定效应模型

当数据包含三个或更多时期时，则需要对相邻时期都进行一阶差分，每个横截面单位都将有多个时期的差分变量，例如 , 等等 (Note: )。在估计过程中，考虑到一阶差分会导致差分后的干扰项存在序列相关，建议使用 GLS 估计，以便获得一致估计量。

有关估计和分析细节，可以进一步参考 Allison (2019)。

4. 参考文献

Allison, Paul D. Fixed effects regression models. Vol. 160. SAGE publications, 2009.
Allison, Paul D. Fixed effects regression methods for longitudinal data using SAS. SAS Institute, 2005.
York, Richard, and Ryan Light. “Directional asymmetry in sociological analyses.” Socius 3 (2017): 1-13.
Allison P D . Asymmetric Fixed-effects Models for Panel Data[J]. Socius: Sociological Research for a Dynamic World, (2019)

5. 附：全文 dofiles

*-下载数据，保存到当前工作路径下. copy 'https://statisticalhorizons.com/wp-content/uploads/nlsy.dta'  nlsy.dta, replace

. use 'nlsy.dta', clear

*-数据概况. des

*-变量的基本统计量. sum  // 下面的结果是用 fsum 命令得到的. fsum

*-回归分析 I：对称固定效应模型   generate antidiff = anti92 - anti90  generate selfdiff = self92 - self90  generate  povdiff =  pov92 - pov90

  regress antidiff selfdiff povdiff

*-回归分析 II：非对称 FE  generate selfpos =  selfdiff*(selfdiff>0)  generate selfneg = -selfdiff*(selfdiff<0)  generate  povpos =   povdiff*(povdiff>0)  generate  povneg =  -povdiff*(povdiff<0)

  regress antidiff selfpos selfneg  povpos povneg

*-假设检验  test selfpos = -selfneg    test  povpos = -povneg

New！ Stata 搜索神器：lianxh 和 songbl GIF 动图介绍
搜：推文、数据分享、期刊论文、重现代码 ……
👉 安装：
. ssc install lianxh
. ssc install songbl
👉 使用：
. lianxh DID 倍分法
. songbl all

🍏 关于我们

连享会 ( www.lianxh.cn，推文列表 ) 由中山大学连玉君老师团队创办，定期分享实证分析经验。
直通车： 👉【百度一下：连享会】即可直达连享会主页。亦可进一步添加「知乎」,「b 站」,「面板数据」,「公开课」等关键词细化搜索。

Stata：非对称固定效应模型