稿件:econometrics666@126.com
所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.
正文
关于下方文字内容,作者:牛坤在,天津大学天津大学管理与经济学部,通信邮箱:kunzainiu002@163.com*读完这个之后,建议可以看看文后附上的二维码里的原文PDF
Keele, L. (2015). The Statistics of Causal Inference: A View from Political Methodology. Political Analysis, 23(3), 313-335. doi:10.1093/pan/mpv007
Many areas of political science focus on causal questions. Evidence from statistical analyses is often used to make the case for causal relationships. While statistical analyses can help establish causal relationships, it can also provide strong evidence of causality where none exists. In this essay, I provide an overview of the statistics of causal inference. Instead of focusing on specific statistical methods, such as matching, I focus more on the assumptions needed to give statistical estimates a causal interpretation. Such assumptions are often referred to as identification assumptions, and these assumptions are critical to any statistical analysis about causal effects. I outline a wide range of identification assumptions and highlight the design-based approach to causal inference. I conclude with an overview of statistical methods that are frequently used for causal inference.
摘要:这篇文章主要提供了一个统计的因果推断概述。关注给统计估计一个因果解释所需要的假设,而不是某一种统计方法,比如匹配。这种假设通常被称为识别性假设,这些假设对于任何因果效应的统计分析都是至关重要的。首先概述了一系列广泛的识别假设,并强调了基于设计的因果推断方法。最后概述了一些经常用于因果推断的统计方法。
1. 引言(introduction)
在生物和社会应用领域,由于原因往往是偶然的,结果很少有独特的原因。在这种情况下,适合使用因果关系的反事实模型。在反事实模型下,通过可观测和不可观测事件来定义因果关系。过去20年,潜在结果框架作为因果关系的反事实模型的一种表现,主导了关于因果关系的统计思维。这是对过去概念的改进。原因是,首先,反事实方法为数据因果关系信息所需的假设提供了新的视野。具体来说,人们对因果推断所需的假设以及这些假设的确切含义有了新的兴趣。其次,重新强调研究设计和基于设计的方法。基于设计的方法没有一个普遍的定义,但是当研究设计被仔细构建以支持估计之前的假设时,统计分析更有说服力。这篇文献提供了一个统计因果推断的路线图,将因果推断的统计分为三个部分:因果识别、基于设计的方法和统计工具。
2. 识别(identification)
2.1 识别的基础(basics of identification)
如果理论上有可能用无穷多个观测值来得到某一参数的真实值,那么就说这个参数是被识别的。但实际上,对于可识别性问题,即使有无限数量的观测值,也没有足够的信息来了解模型中某个参数的真实值。Manski将推理问题分成两部分,识别和统计。前者是指试图描述可以用无限样本得到的结论;后者侧重用有限样本得到一些结论。在统计学中存在很多识别问题。例如,一是使用边际分布识别概率分布混合的参数,试图基于总量推断单元;二是基于缺失数据的推理,可以使用一组关于缺失数据的假设来解决识别问题,或者改变数据收集过程,减少数据的缺失;三是因果推断,由于某些反事实量不可观测,只能通过假设解决识别问题。为了理解因果识别是否成立,必须进行识别分析。识别分析中,需要提供识别特定因果效应所需的一组假设的陈述和证明,当假设成立时,才能从具有无限样本的随机实验数据中计算出因果效应。通常而言,非参数识别分析允许人们陈述识别所需的最弱的一组假设,是很重要的。Rubin Causal Model是形式化因果推断识别问题的一种方法,也被称为潜在结果框架。在潜在结果模型中,每个单元都有多个潜在结果和一个实际结果。潜在结果代表在存在或不存在处理的情况下产生的行为,而实际结果取决于实际接受的处理。实际结果是处理分配和潜在结果的函数。在这个框架下,可以定义一个二元处理Di的层次因果效应的形式,即不同潜在结果的比较。这种比较形式可以是差值或比率。但是由于无法观测到潜在结果,便无法估计真实的因果效应,这成为因果推断的一个基本问题。在这种情况下,关注的是平均处理效果,即ATE(Average Treatment Effect)【ATE = E[Yi1-Yi0]】ATE是在整个群体中平均的一对潜在结果的平均差异,而因果估计通常被定义为特定子群体的平均值。例如对由处理前的协变量(如性别)定义的亚群体进行平均,并且只对女性进行估计。这被认为是更局部的估计,即ATT,被定义为接受处理者的ATE。【ATT = E[Yi1-Yi0|Di=1]】最后,根据潜在结果来定义相关的亚群体,最广为人知的是工具变量。分析人员应该考虑到因果效应可能只在特定的分位数出现。对于上述的这些要求,有些术语是不可观测的,即使拥有无限大小的样本,也不能在不观测两种潜在结果的情况下估计平均因果效应。具体来看,是指分配给处理组样本的比例,可以将ATE分解为潜在结果的函数:
ATE就变成了有5个变量的方程。如果没有额外的假设,我们只能直接从观测数据中估计出其中三个变量,而处于控制状态的单元在处理下的平均结果和处于处理状态下的单元在控制下的平均结果都无法被估计,这两个未观测到的反事实量使我们面临一个因果识别问题。因此,必须找到一套允许识别的假设。在因果推断中,识别通常是基于处理状态独立于潜在结果的假设。当独立性假设成立时,可以将观测结果和潜在结果联系起来。此时,对未观测到的潜在结果的期望等于对观测到的处理分配结果的条件期望。那么,什么时候有理由假设处理和潜在结果之间的独立性?必须假设稳定单元处理价值假设成立(Stable Unit Treatment Value Assumption (SUTVA))。通常由两个部分组成,一是没有隐藏的处理形式,即
;二是受试者的潜在结果不受其他受试者处于处理状态的影响。
第一个部分通常被称为一致性假设,假设对接受处理的单元,我们观察该处理的潜在结果。但是存在争议,因为在实际缺乏一致性的情况下,人们不知道数据在估计哪个反事实的对比。比如,如果处理是15分钟的运动,这里有很多种运动的不同形式,就很难证明任何基于效果评估的决策是正确的,因为我们可能不知道哪种形式的运动实际上使得处理是有效的。支持者认为只要因果模型是正确的,就会出现一致性。因而,如果潜在的结果独立于运动处理,就可以排除其他原因的存在,但是这种处理可能包含其他成分,使得识别是困难的。第二个部分被是一个更严重的问题。如果我们对一个单元进行处理,该单元将一些处理传播到一个或多个控制组群体中,那么就变成了处理单元和部分处理单元之间的比较,因果参数将不会被识别。另外,随着时间的推移,不同的处理方法也可能导致违反SUTVA。最后介绍了两种最常见的识别威胁。首先是由于一个共同的原因造成的混杂。混杂在许多统计文本中被认为是一个虚假的关系,因果变量同时受到其他变量的影响。其次是两个变量同时影响其他变量。这都会导致因果识别的失败。
接下来分别介绍因果分析中的识别策略和解决因果推断识别问题的策略。
3. 识别策略(identification strategies)
识别策略是一种研究设计,旨在解决因果推断的识别问题。本文提出了随机实验、自然实验、工具变量、断点回归设计、可观测值的选择、时态数据可观测值的选择、部分识别等策略。
3.1 随机实验(randomized experiments)
随机实验是指受试者通过随机机制被分配,像投硬币一样。实验的关键在于,研究人员可以强加特定类型的分配过程,增加处理状态和潜在结果之间的独立性。如果处理独立于潜在结果,那么处理效果参数是确定的。在这种识别策略下,研究人员认为独立性成立,处理组和对照组在可观测和不可观测方面的特征都是相同的。这意味着随机化允许排除由于共同原因造成的混杂。1) 必须假设SUTVA是成立的;当随机化后,受试者的结果不可用时,随机实验可能无法给出有效的因果估计;受试者不服从分配的处理状态(详见See Gerber and Green (2012))2) 内部有效性和外部有效性问题:一项随机实验确定了研究中受试人群的处理效果,但这种处理效果可能会也可能不会对其他人群产生影响,因而随机实验通常被认为可能缺乏外部有效性。然而,许多对因果推断感兴趣的人倾向于看重内部有效性而非外部有效性。他们更重视一个执行良好的实验室实验,而非具有非常大的代表性数据样本中观察到的关联。
3.2 自然实验(natural experiments)
自然实验是自然发生的事件,使得单元被随机分配在处理组或控制组,从而在处理分配和潜在结果之间产生独立性。但无法充分肯定自然实验的处理分配一定是随机的。因为自然实验远超出了研究人员的控制,无法知道处理分配是否真的随机。例如,Lyall (2009)探究不加区分的暴力是否会增加叛乱袭击时,利用了炮击模式,这种模式可能是任意的也可能是随机的,他发现处理似乎与处理前的协变量无关。因此,自然实验通常需要仔细论证处理的随机性质。此外,自然实验也无法知道在其他单元内识别的因果效应是否成立。
3.3 工具变量(instrumental variables)
是指通过诱导单元接受处理而影响结果。Holland (1988)概述了将随机激励设计作为工具变量,把这个设计描述为一个激励参与者锻炼的实验。当受试者被随机激励进行锻炼时,受试者选择是否进入锻炼处理组。另外,一些被分配到非锻炼组的人将决定锻炼。最后所有参与者都被测量结果。在这个设计中,由于激励是随机分配的,激励的效果是确定的。这种要求通常被称为意向性分析(intention-to-treat,ITT) 。在额外的假设下,工具变量通过随机激励来确定那些被诱导接受处理的单元的平均效果。它是为一个亚群体而定义的具有局部特征的方法,通常被称为一般因果效应或局部因果效应。为了使工具变量提供有效的因果推断,必须满足五个假设。一是激励的随机分配;二是SUTVA;三是工具变量对结果没有直接影响,也被称为排除约束;四是单调性;五是必须对处理有影响,即相关性。前两个假设与识别意向性分析所需的假设相同,其余三个假设是识别一般因果效应的附加假设。现实生活中可以创造出模仿随机激励设计的环境。Hansford and Gomez (2010) 试图理解较低的投票率是否会降低民主党的得票率。利用在选举日降雨似乎会降低投票率这一事实,将降雨作为一个好像是随机阻碍投票的有效的手段,从而得到局部因果效应。(其他的具体案例和描述见Bound, Jaeger, and Baker (1995) ,Green (2011))相关统计文献的一个重要观点是隐含的常数效应假设的作用。基于回归的工具变量需要一个假设,处理的效果在各个单元之间是恒定的。Angrist, Imbens, and Rubin (1996)表明,在非参数潜在结果框架下,这些假设可以被放宽。
3.4 断点回归设计(RDD,Regression Discontinuity Designs)
断点回归(Regression discontinuity, RD)设计是另一种识别策略,被归类为自然实验的一种。二元处理变量Di是一个已知连续变量Si的函数,Si是分组变量。RD分为两种类型,一种是精确断点回归(Sharp RD), Di是Si的确定性函数,c是一个已知的断点值,当Si<c时,Di=0,否则Di=1;另一种是模糊断点回归(Fuzzy RD),处理变量是一个给定分组变量的随机变量,但是在Si=c处,个体得到处理的概率必须是间断跳跃的。这意味着Si<c时,也有可能得到处理。模糊断点回归导致断点回归和工具变量之间具有等价性,Lee and Lemieux (2010)有更进一步的研究。1) 连续性假设:潜在结果必须是断点值附近分组变量的连续函数。个体样本非常接近断点值,但是处于断点值左右两侧,被认为是可比的或者是彼此的反事实,由此在断点值处可识别因果效应。通常假设在断点值周围有一个邻域,邻域内的处理状态时随机分配的,个体除了接受处理的概率不同,其他方面没有系统差异,那么断点值附近的结果不同归因于处理的效果。2) 断点回归识别了分组变量等于或接近c的局部平均处理效应,因此应该使用断点值附近的被认为是好的反事实的单元集。这里,由于未建模的非线性可能被误认为是处理效果,会出现复杂的情况,详见Angrist and Pischke (2010)。
3.5 选择可观测值(selection on observables)
在这个识别策略下,存在一些协变量,作为处理分配随机化的条件,即假设处理是有条件独立于潜在结果的,以观察到的协变量为条件。处理这个假设的方法包括回归、匹配和加权等。对回归而言,虽然希望能够控制更多影响结果和处理的协变量,但是在没有进一步假设的情况下,不能以任何受处理影响的协变量为条件,这会使估计结果出现偏差,被称为过度控制或不良控制。更复杂的是对处理前协变量的调整可能会导致偏差,被称为M-bias。因此,必须谨慎选择协变量。
3.6 选择时态数据的可观测值(Selection on Observables with Temporal Data)
当数据包含多个时间段时,要求处理组和控制组之间的差异是可观察的这一假设被削弱,可以选择三种不同的识别策略:固定效应、双重差分和基于滞后的识别(详见Angrist and Pischke (2009, chap. 5))。(1)固定效应:如果混杂因素不随时间变化,其未被观察到也没有关系,但必须假设处理效果是线性和相加的。(2)双重差分:关键的假设是在没有处理的情况下,处理组和控制组的结果趋势是相同的。(3)基于滞后的识别:使用过去的结果,这是可观测协变量和不可观测变量的函数,相当于间接的将不可观测变量作为条件。
3.7 部分识别(Partial Identification)
对处理效果设置界限。分析从无假设界限开始,并且增加关于处理反应或分配的性质的假设,从而进行推论。实际应用包括:Lee (2009)使用部分识别方法进行缺失结果数据的随机实验;巴尔克和珀尔(1997)在工具变量识别策略下使用部分识别来放松单调性假设和排除限制;部分识别也支持许多形式的敏感性分析。
3.8 中介分析(Mediation Analysis)
在中介分析中,主要关注将总效应分解为间接效应和直接效应。假设存在依赖于Mi的因果机制,Mi被称为中介变量,间接效应是指处理通过中介变量对结果产生间接影响,直接效应是指通过其他可能的中介产生的处理效果。中介分析包括两种识别。一种是总体效果的可识别性。一种是顺序忽略的假设,排除中介变量与潜在结果之间的混淆。必须首先证明总体效果的可识别性,否则中介分析没有什么用。
3.9 关于假设的推理(Reasoning About Assumptions)
对识别策略的合理性进行推理是因果分析的关键部分,其合理性取决于特定的经验背景。特定背景下选择不同的识别策略的案例如, Sekhon and Titiunik (2012)使用可观测值的选择, Gordon (2011)和Keele and Minozzi (2012)使用DID。只有仔细理解假设才能证明识别策略在给定环境中的合理性。对识别假设的重新阐述能够帮助更好地理解这些假设。相关例子如Lee (2008)开发了一种方法解释RD设计中的连续性假设;Angrist, Imbens, and Rubin (1996)将传统的基于协方差限制的IV假设重新进行陈述。
4. 设计的方法(The Design-Based Approach)
概念:是一种强调设计而不是统计建模的统计分析模式。下面列举了一些技术,是基于设计的方法的一部分,可以用于提高识别策略的可信度。
4.1 减少异质性(Reducing Heterogeneity)
这里的异质性是指处理前,研究单元之间某些特征就表现出相当大差异,导致无法明确处理后的差异是由处理措施导致的。异质性的降低可以通过两种方式实现:随机化前进行阻断和允许更精确地估计处理效果。在一项观察性研究中,减少异质性通常意味着将样本量减少到一个更少、更具有可比性的子集。例如,Norvell and Cummings (2002)在了解摩托车上带头盔是否会降低死亡风险时,通过观察同一行为群体内部发生的结果,进行对内比较,减少了包括道路条件、交通模式、不同速度等因素在内的异质性。虽然反对的观点认为这种做法丢失了部分数据会降低统计效率,但是效率是观察型研究中的次要问题。增加样本量可以将置信区间缩小到排除真实处理效果点的估计的点。增加额外的观测值可能会增加偏差。关注小样本存在其合理性。减少单元异质性相当于将分析限制在整个数据集种更同质的子集,有助于降低抽样的不确定性和不可观测的混杂因素的偏差的敏感性。在小样本中,处理单元和控制单元之间的差异不是通过统计方法而是通过设计来减小的。具体实践的案例参考:Crump et al. (2009), Rosenbaum(2012), and King, Lucas, and Nielsen (2014);Zubizarreta et al. (2013) and Keele, Titiunik, and Zubizarreta (2014)。
4.2 证伪检验(Falsification Tests)
证伪检验的依据是,当我们发现不应该存在因果效应却存在时,意味着隐藏着混杂因素和识别策略的失败。在RD中,通常被称为安慰剂检验。Rosenbaum (2002b)的例子。研究了食用被甲基汞污染的与是否会导致染色体损伤。研究人员收集了许多健康相关的数据,包括受试者是否患有哮喘,发现没有证据证明二者的因果关系。已知甲基汞对哮喘没有任何的影响,研究人员测试了其对哮喘的处理效果,发现二者存在因果关系。因而基于可观察假设的选择是不合理的,处理组和控制组之间存在一些不可观察的差异,产生了不应该存在的处理效果。
4.3 敏感性分析(Sensitivity Analysis)
敏感性分析为识别策略的合理性提供了可量化的陈述。如果一个因果推断是敏感的,轻微违反假设可能导致实质上不同的结论。例如,探讨在考虑与吸烟的联系后,未观察到的混杂因素是否有可能解释肺癌发病率的剩余变化。对许多识别策略,敏感性分析的具体形式尚未开发出来。Rosenbaum (2002b)开发了一种方法理解是否选择可观察的识别假设对隐藏的混杂因素很敏感。在这种方法下,根据推测的混杂水平对处理效果点估计值或p值等数量进行限制。也就是说,混杂程度是给定的,对于该混杂水平,可以计算处理效果点估计的界限。如果零包含在这些界限中,识别策略的失败将逆转该混杂水平的研究结论。人们可以改变混杂水平,观察少量或大量混杂是否会逆转研究结论。
4.4 模式特异性(Pattern Specificity)
通常需要建立多方面的证据来证明因果关系。模式特异性的含义是:应该测试尽可能多地检验因果理论的相关含义,加强因果效应的证据。在此种情况下,设计的一部分是基于因果理论的大量假设的生产和测试。如果一系列测试成功,因果理论的可信度会更高。在这一节中,文章强调了基于设计的方法的重要性。一般来说,基于设计的方法下的因果分析寻求一个合理的识别策略,然后经常使用上述技术来提高该策略的可信度。虽然这些技术中没有一种能够排除隐藏偏见的存在,但它们通常可以提高许多识别策略的可信度。
5. 因果推断的工具(Tools for Causal Inference)
本章介绍了处理效果分析中常用的一些方法。在选择识别策略并且完成设计后,接下来转向因果效应的估计。
5.1 因果图(Directed Acyclic Graphs)
因果图是一种识别工具,而不是统计分析。主要以图形化的方式形式化识别概念。从给定的图中,可以导出非参数识别效果,并识别哪些变量或变量集是识别所必须的。在识别条件很好理解的情况下,如在一个良好的随机实验或自然实验中,它对分析的帮助很小;在可观察的选择下,它是一种有用的方式。
5.2 估计方法(Estimation Methods)
非参数识别成立时,意味着一个有效的非参数估计量。如果分析人员应用一种对处理有线性反应的假设,而实际反应是非线性的,函数形式的错误就会导致效果产生偏差,以致人们认为处理没有效果,而实际上效果是非线性的。因果分析中使用的许多方法往往是非参数或半参数的。这里的回归指最小二乘法、逻辑回归模型等线性、非线性模型。回归模型主要用于根据选择可观测值调整混杂因素。通常与本文描述的大多数识别策略结合使用,例如用于工具变量和断点回归的识别策略。回归模型被视为因果效应的估计,受到了许多批评。一是对其所需的强函数形式假设表示质疑。但是回归模型不必然局限于限制性的函数形式,可以通过核方法等变得更加灵活,用于估计因果效应。二是回归模型通常基于分析者不容易观察到的推断产生处理效果估计。回归系数作为边际效应的基本解释可能导致对回归模型的因果解释是存在问题的,如果不仔细考虑识别策略,这种解释是不合理的。回归模型有助于因果分析。例如,倾向得分是能够测度个体受到特定处理的概率,也经常被使用在匹配或加权的分析中。逻辑回归模型通常被用于估计倾向得分,在因果效应分析中起着关键作用。匹配相当于非参数回归的一种具体形式,在不同识别策略中有多种用途。最常见的是在选择可观测值下结合匹配使用,以使处理组和对照组在观察到的协变量方面相同。也被用于断点回归设计和自然实验等识别策略中。IP加权已经在重复和随时间变化的处理的背景下得到广泛使用。分析人员重新加权观察结果以创建一个伪总体,其中处理和控制单元有条件地独立于处理状态。这种伪总体是通过对研究中的单元用倾向得分的倒数来加权产生的。此外还有许多估计权重的替代方法。
5.3 推断方法(Inferential Methods)
一般来说,在因果效应的研究中,统计推断的模式是不同的。推断的模式是很重要的,因为在因果效应的研究中,不确定性的统计测量取决于如何分配处理。例如,在随机实验中,处理是基于个人还是群体,得到的统计不确定的计算是不同的。处理效果的统计推断通常使用两种不同的框架之一进行定义。第一个框架是与Jerzy Neyman有关,第二个框架由Ronald Fisher开发。在第一个框架下,有两个问题:如果所有单元都接受处理,平均结果如何;如果所有单元都接受控制,与平均结果相比会如何。这个框架下的统计检验是平均因果效应是否为0。第二个框架下,检验的是精确零假设。分析人员检验每个单元的处理效果是否为零。但是这个方法没有检验平均效应为零的零假设。以Imbens and Rubin (2015)为例,假设Y0i=2,对于研究中三分之一的单元,处理效果是2,三分之二的单元,处理效果是-1,平均效应是0。如果只用一种推断模式,只能检测到一种效果。分析人员需要熟悉这两种框架。因为阐明了统计推断的模式是如何起作用的。在Fisherian框架下,推理模式如何根据分配机制二变化是显而易见的。它还允许检验数量而不是平均效果。
6. 讨论(Discussion)
这篇文章倾向于识别因果效应,而不是匹配方法的复杂性或双重稳健估计的相对优点。因果效应统计分析中的许多偏差都源于对识别和估计这两个概念的混淆。对识别的理解揭示了通常可以从因果效应数据中了解到的局限性,以及复杂的统计估计可能无助于识别策略。因果推断需要在许多不同的背景下采取一系列不同的识别策略才能得出结论。本文的一个目标是阐明因果推断统计中的一个重要悖论,最可信的因果推断需要最少的统计分析。事实上,当因果推断可信时,大部分工作是在结果数据收集之前完成的,而不是因为使用复杂的统计方法。接下来要解决的问题是日常统计实践在多大程度上吸收本文提出的因果关系的观点。基于识别的因果推断方法倾向于对基于可观测选择的统计分析持怀疑态度,与所谓的标准统计实践大相径庭。政治科学中的许多应用可以被认为是具有随时间重复的动态处理。关于生物统计学中动态治疗的文献主要是针对一种与社会科学应用几乎没有相似之处的特定类型的临床试验而发展起来的。在为社会科学环境开发动态方法方面,还有许多工作可以做。因果推断也是未来研究的一个重要途径。在识别策略的选择上,由于政治学的许多领域进行随机实验存在困难,部分识别策略值得被应用。
断点回归设计RDD
1.断点回归设计RDD分类与操作案例,2.RDD断点回归, Stata程序百科全书式的宝典,3.断点回归设计的前沿研究现状, RDD,4.断点回归设计什么鬼?且听哈佛客解析,5.断点回归和读者的提问解答,6.断点回归设计RDD全面讲解, 教育领域用者众多,7.没有工具变量、断点和随机冲击,也可以推断归因,8.找不到IV, RD和DID该怎么办? 这有一种备选方法,9.2卷RDD断点回归使用手册, 含Stata和R软件操作流程,10.DID, 合成控制, 匹配, RDD四种方法比较, 适用范围和特征,11.安神+克拉克奖得主的RDD论文, 断点回归设计,12.伊斯兰政府到底对妇女友不友好?RDD经典文献,13.PSM,RDD,Heckman,Panel模型的操作程序,14.RDD经典文献, RDD模型有效性稳健性检验,15.2019年发表在JDE上的有趣文章, 计量方法最新趋势,16.关于(模糊)断点回归设计的100篇精选Articles专辑!17.断点回归设计RDD精辟解释, 保证你一辈子都忘不了,18.“RDD女王”获2020年小诺奖!她的RD数据, 程序, GIS和博士论文可下载!关于她学术研究过程的最全采访!19.中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究!20.最近70篇关于中国环境生态的经济学papers合辑!21.事件研究法用于DID的经典文献"环境规制"论文数据和程序,22.环境, 能源和资源经济学手册推荐, 经典著作需要反复咀嚼,23.中文刊上用断点回归RDD和合成控制法SCM的实证文章有哪些?不看至少需要收藏一下!24.上双一流大学能多赚多少钱? 学习断点回归RDD, 机制分析的经典文章!25.JPE上利用地理断点RDD和IV研究中国环境议题的do文件release!26.中文刊上用断点回归RDD和合成控制法SCM的实证文章有哪些?不看至少需要收藏一下!27.AER上用断点回归设计RDD的实证文章有哪些?含程序和code, 不看至少需要收藏一下!
关于DID相关文章
0.双重差分DID方法免费课程, 文章, 数据和代码全在这里, 优秀学人必须收藏学习!1.DID运用经典文献,强制性许可:来自对敌贸易法的证据,2.连续DID经典文献, 土豆成就了旧世界的文明,3.截面数据DID讲述, 截面做双重差分政策评估的范式,4.RDD经典文献, RDD模型有效性稳健性检验,5.事件研究法用于DID的经典文献"环境规制"论文数据和程序,6.广义DID方法运用得非常经典的JHE文献,7.DID的经典文献"强制许可"论文数据和do程序,8.传销活动对经济发展影响, AER上截面数据分析经典文,9.多期DID的经典文献big bad banks数据和do文件,10.因果推断IV方法经典文献,究竟是制度还是人力资本促进了经济的发展?11.AER上因果关系确立, 敏感性检验, 异质性分析和跨数据使用经典文章,12.第二篇因果推断经典,工作中断对工人随后生产效率的影响?,13.密度经济学:来自柏林墙的自然实验, 最佳Econometrica论文,14.AER上以DID, DDD为识别策略的劳动和健康经济学,15.一个使用截面数据的政策评估方法, 也可以发AER,16.多期DID模型的经典文献,big bad banks讲解",17.多期DID的经典文献big bad banks数据和do文件,18.非线性DID, 双重变换模型CIC, 分位数DID,19.模糊(Fuzzy)DID是什么?如何用数据实现呢?20.多期DID的big bad banks中文翻译版本及各细节讲解,21.DID中行业/区域与时间趋势的交互项, 共同趋势检验, 动态政策效应检验等,22.截面数据DID操作程序指南, 一步一步教你做,23.DID的研究动态和政策评估中应用的文献综述,24.连续DID经典文献, 土豆成就了旧世界的文明,25.DID双重差分方法, 一些容易出错的地方,26.连续DID, DDD和比例DID, 不可观测选择偏差,27.加权DID, IPW-DID实证程序百科全书式的宝典,28.DID和DDD, 一个简明介绍, 双重和三重差分模型,29.DID过程中总结的地图展示技巧,30.DID的平行趋势假定检验程序和coefplot的其他用法,31.截面DID, 各种固定效应, 安慰剂检验, 置换检验, 其他外部冲击的处理,32.实践中双重差分法DID暗含的假设,33.过去三十年, RCT, DID, RDD, LE, ML, DSGE等方法的“高光时刻”路线图,34.计量院士首次用DID方法分析, 中国封城对新冠病毒扩散的影响!,35.截面DID, 各种固定效应, 安慰剂检验, 置换检验, 其他外部冲击的处理,36.诺奖夫妇的中国学生, “DID小公主”的成名之作, 茶叶价格与中国失踪女性之谜!,37.前沿: 反向DID, 反向双重差分法DDR全解析, 辅以实证示例!38.英诺丁汉大学校长为你讲解逐年PSM匹配-DID方法的操作, 并配上自己写的一篇范文!39.逐年PSM匹配后再DID识别因果的实证范文, 这就是逐年PSM-DID的操作范式!40.用事件研究法进行因果识别如何做? 有什么好处? 与DID结合起来潜力无穷!41.Abadie半参数双重差分DID估计量, 使你的平行趋势假设更加可信!42.弹性DID, DID的终极大法, 关于DID各方法总结太赞了!43.二重差分法分析(DID),44.比DID更加灵活的DDID政策效应评估方,45.DID思路和操作,一篇相关实证文献,46.二重差分法深度分析(DID),三重差分兼论,47.面板数据的DID估计,透彻解读,48.PSM-DID, DID, RDD, Stata程序百科全书式的宝典,49.关于DID的所有解读, 资料, 程序, 数据, 文献和各种变形都在这里,50.分位数DID, PSMDID, 政策前协变量平衡性检验操作步骤和案例,51.PSM-DID, DID实证完整程序百科全书式的宝典,52.逐年匹配的PSM-DID操作策略, 多时点panel政策评估利器,53.广义DID, DID最大法宝, 无所不能的政策评估工具,54.渐进DID专治各种渐进性政策的良药, 可试一试疗效,55.双重差分DID的种类细分, 不得不看的20篇文章,56.找不到IV, RD和DID该怎么办? 这有一种备选方法,57.在教育领域使用IV, RDD, DID, PSM多吗? 使用具体References,58.DID和IV操纵空间大吗? 一切皆为P-hacking,59.第一篇中文DID实证论文长啥样? 60.世界上第一篇DID实证论文长啥样?,61.关于双重差分法DID的32篇精选Articles专辑!62.空间双重差分法(spatial DID)最新实证papers合辑!63.空间DID双重差分方法的文献, spatial DID,64.多期三重差分法和双重差分法的操作指南,65.多期双重差分法,政策实施时间不同的处理方法,66.三重差分法运行和示例,67.如何设计双重差分法DID: 各种政策研究的最佳指南! 68.利用DID和事件研究法的Top5文章, 分析最低工资对低薪工作的影响!69.推出输出表格, 滚动回归, 事件研究, asdoc, asreg,asrol, estudy代码和解析!70.中国拖拉机vs牲畜: 事件研究法用于政策评估和因果识别, 与DID结合起来威力无穷!71.事件研究法逐步附上程序code和对应的解释, 这还不懂那就真的没办法了!72.推荐用渐进(多期)DID和事件研究法开展政策评估的论文及其实现数据和代码!
1.合成控制法创始人如何用SCM做实证呢?这些规定动作一个都不能少!2.关于合成控制法SCM的33篇精选Articles专辑!小组惊动了阿里巴巴!3.再谈合成控制法SCM, 帮你寻找因果推断控制组,4.最新: 运用机器学习和合成控制法研究武汉封城对空气污染和健康的影响! 5.合成控制法与HCW方法, 谁能够走得更远?6.广义合成控制法gsynth, Stata运行程序release,7.广义合成控制法gsynth, 基于交互固定效应的因果推断,8.DID, 合成控制, 匹配, RDD四种方法比较, 适用范围和特征,9.合成控制法什么鬼? 因果推断的前沿方法指南,10.用回归控制法HCW(附程序和数据)评估各国经济刺激计划的影响, 真是一个好主意!11.计量院士为你讲解回归控制法HCW的操作, 并配上自己写的一篇范文!12.HCW面板数据政策评估方法, panel数据构造对照组,13.断点回归RD和合成控制法SCM免费课程, 文章, 数据和代码全在这里, 有必要认真研究学习!14.中文刊上用断点回归RDD和合成控制法SCM的实证文章有哪些?不看至少需要收藏一下!
关于IV工具变量方法
1.内生性问题操作指南, 广为流传的22篇文章,2.看完顶级期刊文章后, 整理了内生性处理小册子,3.如何寻找工具变量?得工具者得实证计量,4.内生性处理的秘密武器-工具变量估,5.工具变量在社会科学因果推断中的应用,6.为你的"工具变量"合理性进行辩护, 此文献可以作为范例,7.没有工具变量、断点和随机冲击,也可以推断归因,8.工具变量与因果推断, 明尼苏达Bellemare关于IV的分析,9.工具变量IV与内生性处理的精细解读,10.我的"工具变量"走丢了,寻找工具变量思路手册,11.面板数据里处理多重高维固定效应的神器, 还可用工具变量处理内生性,12.豪斯曼, 拉姆齐检验,过度拟合,弱工具和过度识别,模型选择和重抽样问题,13.工具变量先锋 Sargan,供参考,14.AEA期刊的IV靠不靠谱?15.计量大焖锅: iv, clorenz, rank, scalar, bys, xtile, newey, nlcom,16.GMM是IV、2SLS、GLS、ML的统领,待我慢慢道来,17.IV和GMM相关估计步骤,内生性、异方差性等检验方法,18.因果推断IV方法经典文献,究竟是制度还是人力资本促进了经济的发展?19.内生变量的交互项如何寻工具变量, 交互项共线咋办,20.面板数据、工具变量选择和HAUSMAN检验的若干问题,21.IV和Matching老矣, “弹性联合似然法”成新趋势,22.IV回归系数比OLS大很多咋回事, 怎么办呢? ,23.不用IV, 基于异方差识别方法解决内生性, 赐一篇文献,24.找不到IV, RD和DID该怎么办? 这有一种备选方法,25.内生转换模型vs内生处理模型vs样本选择模型vs工具变量2SLS,26.内生性, 工具变量与 GMM估计, 程序code附,27.GMM和工具变量在面板数据中的运用,28.关于工具变量的材料包, 标题,模型,内生变量,工具变量,29.必须使用所有外生变量作为工具变量吗?30.工具变量精辟解释, 保证你一辈子都忘不了,31.毛咕噜论文中一些有趣的工具变量!33.前沿: 删失数据分位数工具变量(CQIV)估计, 做删失数据异质性效应分析,34.不需要找工具变量, 新方式构建工具变量, 导师再也不用担心内生性问题了!35.关于顶级外刊工具变量的使用最全策略, 不收藏反复读就不要谈IV估计!36.如何通过因果图选择合适的工具变量?一份关于IV的简短百科全书,37.前沿: nature刊掀起DAG热, 不掌握就遭淘汰无疑!因果关系研究的图形工具!38.最清晰的内生性问题详解及软件操作方案!实证研究必备工具!39.中国女学者与其日本同行在JPE上发文了!利用独特数据, 地理断点RDD和IV研究中国环境议题!40.双胞胎样本解决遗漏变量和测量误差, LIV解决选择偏差,41.内生性处理的秘密武器-工具变量估计,42.工具变量IV必读文章20篇, 因果识别就靠他了,43.看完顶级期刊文章后, 整理了内生性处理小册子,44.“内生性” 到底是什么鬼? New Yorker告诉你,45.Heckman两步法的内生性问题(IV-Heckman),46.最全估计方法,解决遗漏变量偏差,内生性,混淆变量和相关问题,47.非线性面板模型中内生性解决方案,48.内生性处理方法与进展,49.万能cmp程序, 有了他, 建议把其他程序全删掉!50.你的内生性解决方式out, ERM独领风骚,51.面板数据是怎样处理内生性的,52.计量分析中的内生性问题综述,53.一份改变实证研究的内生性处理思维导图,54.Top期刊里不同来源内生性处理方法,55.面板数据中heckman方法和程序(xtheckman),56.控制函数法CF, 处理内生性的广义方法,57.二值选择模型内生性检验方法,58.2SRI还是2SPS, 内生性问题的二阶段CF法实现,59.非线性模型及离散内生变量处理利器, 应用计量经济学中的控制函数法!60.最全利用工具变量控制内生性的步骤和代码—在经管研究中的应用,61.如何选择合适的工具变量, 基于既有文献的总结和解释!62.中介效应最新进展: 中介效应中的工具变量法使用方法及其代码!63.弱工具变量的稳健性检验, 附上code和相关说明!64.工具变量对因果效应的识别和外推, 大牛的顶级评述!65.几百年一遇的工具变量让基于OLS的截面数据回归结果发到Top了, 设计巧妙让人叹服!66.一份使用工具变量回归的AER文章清单, 思路惊奇定会让你脑洞大开!67.估计工具变量回归时, 是否必须将所有外生变量用作工具变量?68.引力模型基础上的工具变量如何构建?69.必读, 宗教是如何阻碍经济发展的? 基于DID, IV和各种机制分析的AER量化史分析!70.JPE上利用地理断点RDD和IV研究中国环境议题的do文件release!71.工具变量IV估计免费课程, 文章, 数据和代码全在这里, 不学习可不要后悔!72.天下回归, 无内生性不破, 唯此神文不破, 练就内生性处理的终极大法!73.搞懂因果推断中内生性问题解决方法必读的书籍和文献已搜集好!74.2020年博导圈流传最广的一份“几十种内生性处理方法及其要求和局限”的宝典, 并附上代表性重要文献!75.因变量和内生变量是连续,有序和无序多元变量时, 该如何做工具变量估计?76.太难了! 用天气做工具变量IV都被审稿人质疑! IV竟如此脆弱那有什么IV选取建议呢? 77.天气数据作为工具变量IV的文献清单, 分门别类地为各位整理好了!78.华人金融学术女神为运用工具变量估计方法做因果推断的学者提供了如下宝贵建议!79.你确定找到一个好的工具变量了吗? 这将是一篇最值得你看的文章!80.关于工具变量估计的论证思路,各种检验, 操作代码和实证解读, 这可能是最全面的一份兵法!81.几百年一遇的工具变量让基于OLS的截面数据回归结果发到Top了, 设计巧妙让人叹服!82.一份使用工具变量回归的AER文章清单, 思路惊奇定会让你脑洞大开!83.引力模型基础上的工具变量如何构建?84.使用千年难得的IV+DID方法将中国故事写到了Top5, 设计之巧妙构思之缜密让人叹服不已!84.最全利用工具变量控制内生性的步骤和代码—在经管研究中的应用
1. PSM倾向匹配Stata操作详细步骤和代码,干货十足,2.处理效应模型选择标准,NNM和PSM,赠书活动,3.PSM和马氏匹配已淘汰, '遗传匹配'成因果推断匹配之王,4.PSM, RDD, Heckman, Panel模型的操作程序, selective文章精华系列,5.广义PSM,连续政策变量因果识别的不二利器,6.PSM-DID, DID, RDD, Stata程序百科全书式的宝典,7.在教育领域使用IV, RDD, DID, PSM多吗? 使用具体References,8.分位数DID, PSMDID, 政策前协变量平衡性检验操作步骤和案例,9.逐年匹配的PSM-DID操作策略, 多时点panel政策评估利器,10.执行PSM的标准操作步骤, 不要再被误导了,11.PSM匹配后如何保留配对样本? 1:1, 1:4或更多情况呢?12.逐年PSM匹配后再DID识别因果的实证范文, 这就是逐年PSM-DID的操作范式!13.英诺丁汉大学校长为你讲解逐年PSM匹配-DID方法的操作, 并配上自己写的一篇范文!14.内生性问题和倾向得分匹配, 献给准自然试验的厚礼,15.粗化精确匹配CEM文献推荐, 程序步骤可复制,16.DID, 合成控制, 匹配, RDD四种方法比较, 适用范围和特征,17.匹配方法(matching)操作指南, 值得收藏的16篇文章,18.中国工业企业数据库匹配160大步骤的完整程序和相应数据,19.Match匹配估计做敏感性检验的最新方法, 让不可观测变量基础上的选择无处遁形,20.无需检查协变量平衡性的CEM匹配, 到底有多神气和与众不同,21.因果推断中的匹配方法:最全回顾和前景展望,22.内生性问题和倾向得分匹配, 献给准自然试验的厚礼,23.倾向值匹配与因果推论,史上最全面精妙的锦囊,24.匹配还是不匹配?这真是个值得考虑的问题,25.匹配比OLS究竟好在哪里?这是一个问题,26.倾向匹配分析深度(Propsensity matching analysis)27.广义倾向得分匹配GPSM实证数据, 代码和相关解读结果公开!28.如何正确使用PSM倾向得分匹配, 来自top英文期刊上的分析与总结!29.如何应用政策评估中的反事实框架及匹配方法开展政策效应评估?
关于社会实验方法
1.靠抛掷硬币做大决定对人生的终极影响, 小诺奖在TOP5上用RCT做了最接地气的研究!2.过去三十年, RCT, DID, RDD, LE, ML, DSGE等方法的“高光时刻”路线图,3.RCTs随机控制试验到底是什么, 会是社科研究的必然趋势,4.关于田野实验研究, 你不得不读的一篇综述文章,5.洪永淼等,计量经济学与实验经济学的若干新近发展及展望,6.密度经济学:来自柏林墙的自然实验, 最佳Econometrica论文
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。2.5年,计量经济圈近1000篇不重类计量文章,
可直接在公众号菜单栏搜索任何计量相关问题,
Econometrics Circle
计量经济圈组织了一个计量社群,有如下特征:热情互助最多、前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。