横向因果与纵向因果——计算社会科学的范式探讨
摘要:“因果”是各学科共同关心的议题,近年来,大数据时代的到来和人工智能领域的发展使得因果研究受到愈加广泛的重视。自休谟以来,哲学家、科学家从“因果关系”和“因果机制”两个层次对因果的概念、理论和方法论展开了激烈的争论,形成了因果研究的“横向-纵向”之分野:横向因果关系和因果机制强调结构和事物之间反事实的关联;而纵向因果关系和因果机制强调生成过程。在当前社会科学研究中,因果分析的横向与纵向取向各自存在不可替代的优点和难以避免的缺陷,唯有破除二元对立,将不同视角、不同范式结合起来,发展多元视角下的因果研究才能推动哲学社会科学的因果研究走在前沿。
关键词:横向因果 纵向因果 计算社会科学 社会模拟
“因果”自古以来就是人类认识世界时最为关心的问题,也是各领域科学研究的核心议题。随着大数据和人工智能时代的到来,为推动强人工智能的实现,以统计学、计算科学为代表的数据科学领域对“因果”的定义进行了新一轮的讨论,并依托大数据和机器学习不断发展出新的因果分析方法和工具。数据科学中的因果革命浪潮也推动了其他领域对因果问题的探索,研究者们开始重新对“因果”概念、因果分析技术以及学科内的实证研究进行梳理,产生了一些方法论和研究范式层面的讨论和总结,但这些研究和讨论主要针对某个具体的议题或学科,鲜有从理论和方法论角度对整个哲学和社会科学领域的因果研究进行一般性的分析。
自休谟(David Hume)以来,哲学家、科学家们对什么是“因果”、如何界定“因”和“果”争论不休,产生了纷繁复杂的因果理论和方法论。为了更好地应对因果革命的潮流,我们需要对“因果”有更全面、更系统的把握。在系统梳理哲学社会科学领域有关因果的理论和研究后,我们发现,“因果”概念包含“因果关系”和“因果机制”两个层次,学者们对因果关系和因果机制的定义和讨论又形成了横向和纵向两种视角,基于不同的理论和视角发展出了不同的因果推论和机制研究方法。本文将首先区分因果概念的两个层次,然后介绍因果理论的不同视角,比较不同视角下的因果分析方法,最后谈一谈如何结合横向和纵向视角,推动社会科学的因果研究走向前沿。
(一)“因果”概念的两个层次——因果关系与因果机制
“因果”的概念包含着两个层次——因果关系(causation,causal relationship,causes and effects)和因果机制(causal mechanism)。学术界关于“因果”的理论和实证研究也都围绕着这两个层次进行。对“因果关系”的研究称为“因果推断”(causal inference),其目的是发现和界定两个(或两种)事件、现象、变量之间是否存在“原因”和“结果”的关系,并评估“原因”对于“结果”的因果效应(causal effect)。对“因果机制”的讨论叫作机制性的解释(mechanism based explanation),旨在分析“原因”是如何(通过什么样的路径,受到什么样的调节,经历了何种过程)引起“结果”的,重在揭示从原因到结果的复杂路径与过程在厘清因果概念的两个层次后,我们来回顾当前哲学社会科学的因果理论如何界定因果关系和因果机制。
(二)关联性因果关系和生成性因果关系
哲学中不同的因果理论对因果关系有着不同的定义。Hall将哲学中关于因果关系的理论归纳为关联性和生成性两种视角。关联性视角(dependence perspective)下的因果关系理论将因果关系看作原因和结果(事件、变量、现象)之间(反事实)的依赖和关联关系,是一种横向的(horizontal)视角,著名的因果关系的规律理论(regularityviews of causation,RVC)、反事实理论(counterfactualtheories ofcausation)和概率论(probabilistic theories of causation)等都以关联的视角看待因果关系。
生成性视角(productive perspective)下的因果关系理论认为因果关系指的是一个事件(或现象)的发生能够引起另一个事件(或现象)的发生,强调原因“导致”结果的过程,是一种纵向的(vertical)视角。哲学中的干预主义因果关系理论等都属于生成性视角下的因果关系理论。
因果关系的哲学理论为社会科学界定和推理因果关系提供了理论基础和方法论指导,在综合了上述理论的基础上,社会学也对因果关系有着不同的界定。Goldthorpe总结出社会科学理解和界定因果关系的三种方式:(1)稳健的相关(robust dependence):我们如果要对X和Y之间的因果关系作出论断,需要证明在控制了所有其他可能影响Y的因素集合Z时,X对Y的影响还存在;(2)重要的干预(consequential manipulation):也就是说,真实的因果关系应该是当原因X被“操纵”之后,在适当的控制下,结果Y会受到系统性的影响;(3)生成过程(generative process):即我们需要从一个过程中观察到稳定的关系,才能对因果关系作出论断。不难发现,在这几种看待因果关系的方式中,“稳健的相关”所采用的是关联性视角,强调变量之间的稳定的关联;“重要的干预”和“生成过程”则以纵向的、生成性视角来看待因果关系,强调变化和过程。
(三)横向因果机制与纵向因果机制
Casini 和Manzo借鉴了Hall的分类体系,以横向—纵向为坐标,将因果机制理论分为横向机制和纵向机制两类。哲学中,横向视角下的机制理论将机制看作(将不同部分或成分组织起来的)一种稳定的结构,横向机制所讨论的因果关系是关联性视角下的因果关系。而纵向因果机制所讨论的是生成性视角下因果关系的作用机制,在纵向视角下,机制常常被放在复杂系统中进行讨论:机制包含着实体和行动,这些实体和行动的组织方式决定着它们将以什么样的方式来产生现象,也就是说在一个由多个不同的个体(或部分、成分等)、个体的行动和个体之间的互动构成的复杂系统中,某一个体的行为(或属性的改变)能够引发其他个体的某种行为(或属性的改变),且个体之间的互动能够引起系统层面现象或行为的产生,那么机制就是能够引发系统现象或行为的互动着的个体之间稳健的关系。
由此可见,因果机制理论的横向和纵向视角的差异在于,前者强调稳定的结构;后者不仅关注结构,更关注行为与变化的过程:“实体必须处在合适的位置、结构和方向中,实体所参与的行为必须有时间上的顺序、速度和时间期限,并且机制对相关实体、特征和行为的描述需要将它们连在一起来展示实体在某一个阶段的行为是如何影响后续阶段的行为的。社会科学对于横向和纵向因果机制也有类似的理解。持横向机制视角的研究者将机制看作变量之间的稳健的关系网络,而所谓因果机制,就是“原因变量通过一系列变量的中介作用而影响结果变量”。而持纵向机制视角的社会科学研究者则认为,统计方法只能描述整体层面的现象,真正的机制需要对微观个体与宏观现象之间的关系作出解释,因为宏观的、社会整体层面的现象往往是通过个体行动者的动态的、非线性的行动和互动而涌现出来的,我们需要还原涌现现象产生的过程才能把握因果机制。
(四)社会科学研究范式中的横向与纵向取向
当前的社会科学研究存在三种范式:观察、实验和社会模拟。值得一提的是,无论采取哪种范式,若要对“因果性”作出界定必须满足“反事实”的前提,统计学和社会科学对反事实与因果推断进行了丰富而详细的讨论,在此不再赘述。
观察研究是社会科学最常见的研究范式,我们用Y=f[see(X)]的形式来表示。研究者基于由调查、普查、线上爬取等方式获得的结构化与非结构化的(静态的)观察数据,求解自变量X与因变量Y之间的反事实的关联关系f。
由此可见,观察研究对因果关系的界定采取了横向的、关联性的视角,因果关系被界定为观察到的变量之间存在稳健的、反事实的关联。在实际研究中,研究者需要借助统计模型来验证和求解变量之间这种稳健的、反事实的关联。在过往的研究中,研究者主要采用潜在结果框架下常见的倾向性得分分析方法(如匹配、分层和加权)、工具变量方法、内生转换模型和因果结构模型框架下的路径分析、结构方程模型等传统的统计模型。近年来,随着机器学习的方法向社会科学领域的渗透,因果树(causal tree)与因果森林(causal forest)、贝叶斯累加回归树(Bayesian additive regressiontrees)、基因匹配(genetic match)、双重稳健方法(double robust method)、广义提升算法(generalized boosted method)等机器学习方法也逐渐被用于社会科学的因果推断。
实验研究(尤其是随机实验)被认为是因果推论的黄金准则,可以表示为Y=f[do(X)]。实验研究在进行因果推论时所采用的是纵向的、生成性的因果关系视角。在实验研究中,研究者以控制组作为对比基准,对实验组的研究对象进行某种干预,观察当改变X时Y如何变化,并与X不变的情况作对比,我们就可以对X和Y之间的因果关系做出推断。
由于社会科学研究的通常是整体层面的现象而不是单独的个体,所以我们需要对多个研究对象重复这一过程来判断这一因果关系是否有效。因此,需要收集实验组和控制组在实验前后的数据,借助一些统计模型来验证我们对因果关系的假设,并从数量上评估原因对于结果的因果效应。例如研究者通常借助双重差分法、断点回归等模型来估计某项政策的效果。但由于在现实社会中进行实验存在着诸多困难与限制,因此实验研究的范式在社会科学研究中使用较少。近年来,随着互联网的发展,线上实验成为研究者的新的选择。
观察研究和实验研究虽然采取了不同的视角对因果关系进行推断,但这两种范式下的因果机制分析都采用了横向因果机制的视角,研究者通过在研究中增加中介变量,使用路径分析、结构方程模型等方法来分析、验证和估计中介效应,并用原因变量、中介变量和结果变量的有向无环图(directed acyclic graph,DAG)表示原因对于结果的作用机制。
社会模拟的范式以基于多主体的建模(agent based modeling,ABM)为代表,这一范式无论是对因果关系界定还是对因果机制的分析都采用的是纵向的、生成性的视角,社会模拟与前两种范式存在较大的差别,我们用Y=f[rule(X)]来表示:其中Y表示我们所要解释的社会现象,X表示若干个行动者,行动者具有不同的属性,rule表示行动者的行动以及与其他行动者的互动规则,我们可以通过模拟来展示出微观互动是如何涌现出特定的宏观现象的。在这一过程中,行动者采取的行动和行动者的互动是社会现象产生的原因,而行动者之间的关系、行动者的行动和互动是如何“一步一步”导致特定现象产生的这一过程便可以作为对特定社会现象产生的机制性的解释。
但社会模拟的范式在因果推论上存在较大的局限性,因为ABM的参数完全由研究者设定,其模型的外部效度——模型在多大程度上能解释现实社会——常常遭到质疑。此外,模拟研究本身存在着模型复杂度与模型真实性的矛盾,过于简单的模型常常因远离现实被批判为思维实验,过于复杂的模型虽然更接近现实,但不能帮助我们抽象出因果性的知识。
(五)破除二元对立,发展多元视角下的因果研究
在当前社会科学研究中,研究者往往采用单一的研究范式来讨论因果问题。由于不同的范式所采取的因果视角不同,研究范式间的相互孤立使得社会科学的因果研究出现横向和纵向取向的对立。这种对立在对横向和纵向因果机制的争论中更为突出。
以Hedstrom等为代表的纵向机制论者猛烈批判横向机制理论将机制看作变量之间的网络关系的观点,他们指出,社会学使用多变量的路径分析模型的传统仅仅是将机制作为一种语言上的修辞。Pawson通过对机制的概念进行元理论(meta theoretical)的讨论进一步指出,“虽然机制的表达方式可能会在认知上让我们感觉到是在将量化的变量和我们的理解相联系,但是从概念上来说,我们不能将机制等同于变量之间的联系,从方法上来说,我们也不能将机制操作化为对一系列干预变量的统计控制”。
而以Morgan和Winship为代表的横向因果取向的研究者认为,横向取向的因果推论和机制分析能够通过实证分析告诉我们为什么原因和结果之间的反事实相关关系存在,且从模型中得出的因果机制是能够与现实(数据)对应的。纵向取向的机制不但不能做到这一点,其本身在概念和方法论上都存在问题:纵向视角对机制的定义非常模糊,如果机制是指一个动态的复杂系统,其复杂度可以任意调整,其参数有无数种组合的方式,在这种情况下,我们无法排除能够引起同样现象产生的其他机制的存在,也无法对模型所设定的生成机制进行反事实的验证。
从以上争论可以看出,因果研究的横向和纵向取向都存在不可替代的优点和不可避免的缺陷,横向因果关系和因果机制能够通过分析数据进行反事实的验证,但不能体现原因引起结果的过程;纵向因果能够展示原因引起结果的过程,但难以得到现实数据的验证。因此,为了更好地解决因果问题,我们应该尝试在因果分析的过程中将两种视角结合起来。幸运的是,随着统计和计算机模拟技术的发展,新的因果推论方法的出现为二者的结合提供了路径参考。
第一种路径是为横向的因果关系提供纵向的机制性解释。也就是说,我们先采用横向的因果分析方法对因果关系作出论断,计算出变量之间的关系,再使用数据驱动的ABM将实证数据和模型的参数作为ABM模型的初始设置进行模拟,从而对其因果作用机制提供一个可能的解释。
第二种路径是直接在横向因果分析中纳入生成性因果关系的视角,这一路径下的典型方法是使用贝叶斯因果图(Causal Bayesian Networks)。贝叶斯因果图是因果结构模型中的一种类别,是一种特殊的DAG。如前文所述,DAG以关联性的视角将变量之间(反事实)的关联关系作为因果关系,以横向的视角将变量之间的关系网络作为因果机制。和一般的DAG不同的是,贝叶斯因果图使用Do算子(Do calculus)来对变量之间的关系进行反事实的推理,而Do算子在进行运算时采用数值模拟的方式对变量进行“干预”:对原因变量的数值进行改变,从而观察原因变量的改变如何引起结果变量的变化;并且由于在对每个变量进行干预时都会切断指向该变量的其他连边,因此在对一个变量进行操作时,整体的网络结构不会发生改变。这一巧妙的设计使得贝叶斯因果图既能够在关联性的因果关系中体现出生成性,也能保证因果机制的稳定性和可验证性。
但横向与纵向取向的因果分析相结合的这两种路径目前尚处于发展阶段,已有的方法还只适合做理论驱动的、验证性的因果分析,依赖于研究者首先对因果关系和因果机制提出假设,再使用模型对假设进行验证和模拟。但人脑所思考的维度是有限的,正如拉姆斯菲尔德(Donald Rumsfeld)所言,“There are known unknowns, but there are alsounknown unknowns”。目前,统计学、计算科学、系统科学、人工智能等领域正在探索数据驱动的因果发现方法,作为社会科学的研究者,我们应不断将这些新的思想和方法整合进社会科学的因果研究框架中,从而推动哲学社会科学的因果研究走在前沿。
(
(本文作者:梁玉成 中山大学社会学与社会工作系教授;贾小双 中山大学社会学与社会工作系博士生)