《理商:如何评估理性思维》【3】

.

%《理商:如何评估理性思维》

译者序我们不得不承认现代理性的概念主要起源于西方。从古希腊的智者学派,到文艺复兴,再到启蒙运动,其主要内容,甚至核心内容就是理性。中国传统文化崇尚人伦和仁义礼智的天理,并不推崇理性。虽然《后汉书·党锢列传》中首次出现了“理性”一词,但主要指人伦和天理,以至于直到今天我们的教育体系中仍然缺乏针对理性思维的专门教育课程,甚至连基本的逻辑课也鲜有开设。个别的教育工作者常常凭直觉认为,学生学好了数理化等科学知识,就自动具有了理性思维。但实际情况并非如此,现今社会上充斥着大量的非理性思维和行为。比如,有些人深信包含反科学思维和阴谋论的“民间智慧”;很多人会用循环论证的方式解释各种现象;还有不少人盯着高回报去投资各种不靠谱的民间集资和网络金融项目;有的父母不顾孩子的特点拼命去报各种培训班,然后有选择性地评价利弊;创业者在没有可盈利的商业模式的情况下疯狂烧钱,最后不得不黯然离场……人们交着五花八门的“智商税”(其实准确表述应该是“理商税”),不一而足。令人称奇的是,尽管民众并不能准确定义理性,但这并不妨碍他们对理性概念的运用,如在我们谈婚论嫁时,在我们想辞职创业时,父母和朋友总是苦口婆心地说:“要理性一点。”党的十八大、十九大报告连续提出了“培育自尊自信、理性平和、积极向上的社会心态”的重要论述,可见“理性”是一个关系到个人心理健康乃至整个社会和谐的重要概念。那么理性到底是什么意思?该如何评价?又该怎样培育呢?本书就很好地解答了这些问题!本书以世界上第一个理性思维测验——理性思维综合评估测验(Comprehensive Assessment of Rational Thinking,CART)为核心内容,共分3部分15章,系统地描述了理性的概念,以及评估理性的技术方法和科学原理。其中第一部分主要介绍了有关的理论基础,如理性的概念和内涵、理性与智力的关系、著名的三重心智模型,并剖析了人类有限理性的主要认知过程,等等;第二部分则以CART为框架,详细介绍了每个分测验的设计原理和具体的实施细节;而第三部分主要介绍了CART的相关研究情况及其在社会应用方面的价值。本书主要适合心理学、社会学、经济学等相关专业人员,以及对思维科学感兴趣的大众读者阅读。我们希望各位亲爱的读者通过阅读本书能够深刻认识到:现代世界所提供的情境往往是我们在进化过程中形成的默认认知系统难以适应的。现代社会的环境不断促使人们对信息进行去情境化处理,人们必须学会用抽象的方式处理信息,而不是依据特定背景来处理信息,即需要用理性战胜冲动。本书的第一作者是加拿大多伦多大学的斯坦诺维奇教授,他是国际理性研究领域的集大成者。他不仅是一位卓越、严谨的心理学家,还是一位可以深入浅出讲解科学研究的科普大师。本书的英文版行文深刻,用词丰富多样,体现了作者高超的学术水平和深厚的语言功底,但同时也给本书翻译的信、达、雅带来了巨大的挑战。感谢整个翻译团队的辛勤工作,特别感谢陈雨琴女士为本书翻译所做出的杰出贡献!虽然我们的翻译团队从事理性研究已有7年时光,但由于文化背景差异和学识所限,本书的翻译难免有不精准之处,还望各位读者及时给我们指出,以免因我们的翻译掩盖了本书的学术光芒。心理学已经有两个著名的商数——智商和情商,这两个概念的提出轰动了当时的世界,并极大地推动了教育、心理、人力资源等领域,乃至整个世界文明的发展。在此,我们理性地认为,“理商”概念的提出和本书的出版,也必定会深刻地促进全社会的进步和发展。正如2002年诺贝尔经济学奖获得者卡尼曼评价的那样:理商是目前最好的分析认知错误的方法,理商概念的提出是理性心理学研究的重大突破!肖玮 谨识2020年1月7日午夜,西安前言一个看起来不太聪明的人做了傻事,我们通常不会感到惊讶。但当一个看起来很精明的人做了傻事时,我们会很吃惊。我们为什么要吃惊呢?聪明人其实常常会做傻事。比如,在2008年的金融危机中,从投资不良金融证券的理财者,到认为房价在三年内就会翻一番的购房者,随处可见聪明人做傻事的情况。如果聪明人做傻事并不罕见,那我们为什么要感到惊讶呢?事实上,这主要是由民间对“聪明”概念理解的混乱和不一致所致。这里有必要对聪明的概念进行解读。大家可以参阅我们在《为什么聪明人如此愚蠢》(Why Smart People Can Be So Stupid,Sternberg,2002)一书中参与撰写的相关章节。字典里对“聪明”(smart)一词的典型定义是“思维敏捷、聪明伶俐”或“具有或表现出敏捷的智力,或具有迅速反应的心智能力”。根据字典的解释,“聪明”一词含义丰富,包括智慧高超。字典同时还告诉我们,“愚蠢”(stupid)的人“学习、理解缓慢,缺乏或被认为缺乏智慧”。如果聪明的人具有智慧,愚蠢的人缺乏智慧,那么怎么会出现“聪明人做傻事”的矛盾情形呢?不过,“愚蠢”一词还有第二种定义,即“做出错误的决定或疏忽大意”,这就能解释“聪明人做傻事”了。当我们分析短语“聪明但是笨”(smart but acting dumb)中的“笨”(dumb)一词时,也会发现聪明和笨其实并不冲突。“笨”的第一种定义是“智慧”的反义词,也是让我们感觉矛盾的原因。但当人们将“笨”一词用于描述决策或行动时,如“做了多么笨的事情啊”,采用的是“笨”的第二种定义,类似于“愚蠢”的第二种定义。民间对愚蠢和笨的理解通常是采用了它们的第二种定义。“傻”(foolish)这个词也是如此。一个“傻”的人“感知和判断力差,不敏感、不明智,缺乏判断力,考虑不全面”。这就是我们想要强调的“傻”和“笨”含义的一部分,这个部分不是通常我们所说的智力低下,而是指做出明智决策的能力出了问题。我们通常所说的“聪明但是笨(或傻)”,其实表明了这样一个现象:聪明的人可能会持有不合理的信念,采取不明智的行动。大众心理学中的“聪明”其实包含了两个不同的特性:智商高和决策理性(拥有理性思维)。如果我们能正确理解这两个特质的不同,那么我们就不会对“聪明但是笨(或傻)”这种现象感到惊讶了。人们之所以长期对这个现象感到惊讶,是因为人们常常将两个特质混为一谈或认为它们至少是紧密关联的。由于心理学有测量第一个特质的工具(智力测验),但没有测量第二个特质的工具,这进一步加深了人们对这两个概念的混淆。心理学中对智力(intelligence)的测量历史已超过一百年。虽然目前也有关于理性思维的研究,但起步很晚,且忽略了个体差异。我们的研究团队是目前进行理性思维个体差异研究时间最长的团体之一。在本书中,我们将通过介绍世界上第一个理性思维测验——理性思维综合评估测验(CART)的结构来综述这方面的研究。心理学的初学者可能会感到困惑:智力的定义应该包含了理性(rationality)。确实,许多智力的定义在提及决策和判断时包含了理性的概念。那些强调行为适应力的智力定义其实也将理性纳入了智力的范畴。然而,还没有哪个智力测验能够测量人们的理性成分(如适应性反应、良好判断、决策制定等)。智力测验的开发者和支持者鼓吹智力测验在心智评估方面是万能的,即使不是万能的,智力也与认知领域的其他方面高度相关。但事实上,智力测验不等同于理性思维测验。为了测量理性,我们需要专门构建一个理性思维测验。这就是我们这本书的主旨。我们已具备扎实的理论基础和大量测量理性成分的题目(Baron,2008;Kahneman,2011;Stanovich,2011),完全可以围绕理性思维这个概念从头开始构建理性思维测验。我们结合20年来相关的理论工作和实证研究(Stanovich,1993;Stanovich & West,1997,1998c)构建了本测验。我们在对人类判断和决策的实证研究(Kahneman,2011;Manktelow,2012)以及对理性的理论探讨(Evans,2014;Stanovich,2011,2012)上取得了长足进步。多年来,我们一直在思考,如何构建一个最佳的理性思维测验。因此,我们在构建测验时尽量让其与智力测验区别开来。这一点需要详细说明,因为很多人认为我们在试图改进智力测验,这是对我们工作的严重误解。我们再次声明:改进智力测验不是我们的目标!与其他学者不同,我们认为将人类所有的认知技能,特别是某些学术和民间概念,如理性、创造力、智慧、批判思维、开放性思维、反思、对证据的敏感性等,都贴上智力的标签是没有意义的。那些声称智力代表一切的理论家其实夸大了智力的概念,而智力测验所测量的内容并不包括上述这些概念。例如,霍华德·加德纳(Howard Gardner)和罗伯特·斯滕伯格(Robert Sternberg)等学者定义了诸如实践智力、身体运动智力、情绪智力等概念。我们认为这些学者对智力采用的是一个宽泛的定义,而不是有科学测量基础的严谨定义。宽泛的智力定义包括了日常用语中“智力”一词所指的更多的心理功能,如环境适应力、明智、创造力等,而无视这些心理功能能否被已有的智力测验所测量。相比之下,严谨的智力定义是指一系列能被智力测验所测量的心智能力。宽泛的智力定义掩盖了已有智力测验未能测量的东西。为了聚焦于智力测验所漏掉的要素,我们采用了严谨的智力定义。我们的研究并不是想改进现有的智力测验,而是想全面评估理性,探究理性的哪些子成分与智力有关,哪些子成分还没有被揭示出来。所以我们没有用智力作为理性测验的效标(无论是否有相关性),而是采用哲学和决策学文献中关于认识性理性和工具性理性的理论体系(Manktelow,2004;Over,2004),以及启发与偏差(heuristics and biases)领域的实证研究来构建我们的测验。我们的目标一直聚焦于给理性赋予一个比“智力”更严谨的定义。如果目标实现,那么接下来的问题就是该如何评估理性,以及综合的理性测验应该是什么样子。可以说,我们正在进行的是一项涉及理论基础和实际应用方面的重要研究。我们不是试图改善智力测量工具,也不是为了提高智力测验的效度而努力(无论我们的理性测验能否预测智力测验所不能预测的重要行为变化),我们也不关心诸如同时实施理性思维测验和智力测验导致测验时间过长等实际问题。我们还需要探讨理性思维(和它的子成分)与智力的相互关系。如果谁在一个随机样本中发现,一个潜在的理性变量和一个潜在的智力变量存在完美的相关,我们会第一个站出来说:“智力测验是多么非凡的工具啊,这些年来我们竟然都不知道,它还能精确地测量理性的个体差异。”然而,从另一个角度来说,只有当人们在研究工作中不过分夸大智力测验的功用时,我们的批判才不会那么激烈。无论实证研究的结果如何,我们的工作至少为理性思维概念提供了一种可能的测量方法。但再次声明,我们没有基于理性与智力的关系(或两者原本就不相关)来设计我们的理性测验。我们构建测验内容的原则是:如果一个理性思维成分有心理学的理论和研究支撑,我们就会将它纳入我们测验内容的备选范围。在我们的社会中,能够被测量的东西才有价值。我们利用理性思维综合评估测验(CART)系统地测量理性思维,旨在引起人们对理性思维技能的更多关注。智力概念的实际测量要早于理性的测量,这只是历史上的一个偶然事件。如果说智力的实际测量工作起源于斯皮尔曼(Spearman)或比奈(Binet),那么我们就可以说理性的实际测量工作起源于20世纪四五十年代的公理化方法(axiomatic approach),以及冯·诺依曼(von Neumann)、摩根斯坦(Morgenstern)和萨维奇(Savage)的效用理论。用公平的视角审视我们的研究,就需要忽略智力测量比理性测量出现得更早这个历史偶然事件。再一次强调:我们不是想做出一个更好的智力测验,也不是想尝试在智力测验中增加某些内容,来进一步改善智力测验的效度。我们只是想将理性思维作为一种独立的心理结构来进行测量。我们希望能突出强调理性思维领域的重要性,因为这一思维领域的重要性已经长期被声名显赫的智力测验及其他替代测验所掩盖。我们早就应该有更系统的方法来测量这些认知成分,因为它们本身就很重要,但在智力测验中被忽视了。在哲学和心理学中,理性思维有很好的理论基础,而且它的许多子成分已被很好的研究范式所证实。我们将在这本书中详细讲述我们是如何把这些研究变成世界上第一个全面的理性思维评估工具的。.%《理商:如何评估理性思维》

致谢自从1993年斯坦诺维奇提出“理性障碍”(dysrationalia)一词后,理性思维综合评估测验(CART)的构建和这本书的撰写就成了必须要做的事情。然而,这些工作成果不会凭空产生,理论构建和实证研究工作历时二十多年!在实证研究工作的早期,我们首先在理性思维个体差异方面开展研究工作(Stanovich & West,1997,1998c,1999),主要涉及的领域是双加工理论、进化心理学与认知神经科学间的理性大争论(Great Rationality Debate)等(Stanovich,1999,2004;Stanovich & West,2000)。后续的实证研究(Stanovich & West,2008b)产出了《超越智商:为什么聪明人也会做蠢事》[1](What Intelligence Tests Miss,Stanovich,2009)一书。在这本书中,我们明确指出,没有任何东西可以阻止我们去构建理性思维测验。我们在后续论著的相关章节(Stanovich,2011;Stanovich,West,Toplak,2011a)中概述了评估理性思维的早期框架,并提出了一些建议性的任务。那些熟悉我们早期框架的人在阅读本书时会注意到一些根本性的改变。这些变化源于我们在第三章和第四章中提出的启发与偏差任务的最新概念。约翰·邓普顿基金会(John Templeton Foundation,JTF)的资助极大地加快了本书的撰写和理性思维综合评估测验(CART)的问世。也正是由于该基金会的支持,斯坦诺维奇和韦斯特可以有三年的时间专注于该题目,合作者玛吉·托普拉克也有时间参与进来。苏珊·阿雷拉诺(Susan Arellano)在项目资助申请工作中做出了重要贡献。最初由克雷格·约瑟夫(Craig Joseph)帮我们进行JTF资金的管理,在后续的大部分时间里,我们的基金由Character Virtue Development部门的总监萨拉·克莱门特(Sarah Clement)掌管。理查德·博林杰(Richard Bollinger)和凯特琳·扬斯(Caitlin Younce)协助我们处理了很多相关行政事务。需要说明的是,本书中所表达的是各位作者的观点,并不一定反映约翰·邓普顿基金会的观点。我们还要感谢麻省理工学院出版社的编辑菲尔·劳克林(Phil Laughlin)先生,他从一开始就对这个题目充满热情,帮我们很快地完成签约,本书从编撰到出版都是非常高效的。在这个复杂而困难的题目上我们总能感受到编辑一直以来强有力的支持。此外,朱迪·费尔德曼(Judy Feldmann)在文稿的编辑和修订上给予了很大的帮助。我们在好几个重要会议上深入探讨了我们的想法,分别是:在英国达勒姆举行的第四次国际思维会议;在英国剑桥大学,由乔纳森·埃万斯(Jonathan Evans)和基思·弗兰基什(Keith Frankish)组织的关于推理和理性的双过程理论(dual-process theory)的会议;在弗吉尼亚大学,由蒂姆·威尔森(Tim Wilson)和乔纳森·埃万斯组织的双过程理论工作坊;在意大利威尼斯举行的第六次国际思维会议;由瓦莱丽·雷纳(Valerie Reyna)组织的美国国家科学基金青少年和青年高级认知工作坊;以及在伦敦举行的第七次国际思维会议。从引用的文献可以看出,我们在这本书上付出了很多的心血。几十年前,丹尼尔·卡尼曼(Daniel Kahneman)和阿莫斯·特沃斯基(Amos Tversky)的工作激发了我们对当时在心理学领域新出现的理性思维任务的浓厚兴趣。我们早期(Stanovich,1999;Stanovich & West,2000)和后来(Stanovich,2011;this volume)的双加工理论研究受到了乔纳森·埃万斯的启发。而我们早期的有关理性思维个体差异的研究则受到了乔纳森·巴伦(Jonathan Baron)的开放性思维的影响。戴维·珀金斯(David Perkins)提出的术语“心智资源”(mindware),我们已经用了很多年了。普利茅斯大学的乔纳森·埃万斯阅读了完整初稿,并提出了许多极富见解的修改意见。特别是他基于对本书所覆盖的大量文献的广泛了解,帮助我们构建了本书的整体构架。在接受约翰·邓普顿基金会的资助之前,我们的研究经费来自加拿大社会科学和人文研究理事会(Social Sciences and Humanities Research Council of Canada)和加拿大首席研究计划(Canada Research Chairs program)对基思·斯坦诺维奇的资助,还有加拿大社会科学和人文研究理事会对玛吉·托普拉克的资助。过去20年中,斯坦诺维奇/韦斯特/托普拉克实验室(一个由多伦多大学、詹姆斯·麦迪逊大学和约克大学构成的联合实验室)的很多成员在一定程度上都为本书的撰写做出了贡献。我们特别要对理查德·霍恩(Richard Hohn)和特里斯坦·柯克曼(Tristan Kirkman)在詹姆斯·麦迪逊大学实验室的管理工作及研究辅助工作方面所做出的贡献表示深深的谢意。在获得终身教职之前,克里斯托夫·鲁尼恩(Christopher Runyon)、丽贝卡·马什·鲁尼恩(Rebecca Marsh Runyon)和拉塞尔·梅泽夫(Russell Meserve)为管理詹姆斯·麦迪逊大学实验室也做出了杰出的贡献。心理学研究生部主任罗宾·安德森(Robin Anderson)和行政助理罗莎·特纳(Rosa Turner)在我们申请约翰·邓普顿基金会的资助时提供了很多支持。在约克大学实验室,我们得到了大卫·弗洛拉(David Flora)博士(统计顾问)的学术支持,以及实习生杰夫·佐尔格(Geoff B.Sorge)、亚历山德拉·巴西尔(Alexandra Basile)和穆罕默德·艾尔哈尔(Mohamed Al-Haj)的协助。我们在多伦多大学实验室的工作比其他两个实验室的工作开展得都要早,该实验室前几年的关键管理工作由卡罗琳·何(Caroline Ho)、罗宾·麦弗逊(Robyn Macpherson)和沃尔特·萨(Walter Sá)共同完成,在此一并感谢。[1] 机械工业出版社已于2015 年出版此书。——译者注第一部分 理论基础第一章 哲学、认知科学和民间对理性的定义理性在学术界是一个令人困惑又颇受误解的词,有多种定义并充满争议。哲学、经济学、决策学以及心理学等很多学科都对理性感兴趣,但各自的定义却存在差异。例如,动物行为学者声称可以测量不同动物的理性程度(Kacelnik,2006),但根据其他学科的定义,动物根本不具有理性。不同学科的学者们只在一件事上达成了一致:理性的定义存在学术领域间的差异性。例如,经济学家罗伯特·弗兰克(Robert Frank,2004)指出,“理性有许多定义,每个定义都有长处和弱点。理性概念的模糊性很大程度上源于一个简单的事实,即还没有哪个定义能够代替其他学科的定义。”哲学家苏珊·赫尔利和马修·努兹(Susan Hurley & Matthew Nudds,2006)同样认为,“在人类理性的研究中,不同的学科由于研究假设和目的不同,因而从不同的视角来理解'理性’,有些侧重于理性行为,另一些则关注理性的过程,因此在跨学科讨论理性时往往存在争议。”跨学科的争议往往还不是最严重的问题,最严重的问题在学科内部,如在心理学中也已衍生出了很多相似的术语,让人难以辨别。我们不打算对所有这些问题都进行评述,而只是阐述我们在这本书中所使用的术语。在这里,我们不可能解释所有理性相关的概念,而是基于我们的目标来选择术语和定义,即通过一个测量理性思维的综合方法来展现理性应有的样子。测量理性的评估工具需要一个基于实证研究,并具有可操作性的定义,因此本书的理性概念主要来自于决策理论和认知科学领域。不具备实证和可操作性这两个特征的定义对于构建理性思维测验是毫无价值的。此外,我们还希望这个定义能够体现出个体差异,从而使其建构能够反映人的思维和判断从不理性到高度理性变化的连续体(continuum)。与此相对照的是,许多关于理性的哲学概念都只是为了将所有的人等同起来。因此,本书通过构建一些标准来定义我们所希望研究的具有个体差异的理性。然而,许多人已经习惯了这种将人等同看待的理性思维的哲学定义。由于这些定义深入人心,从而会使人们在理解我们的定义时产生困惑。无论一个人事先是否熟悉“理性”这个术语,我们都会敦促我们的读者不要纠结于此,如果你不喜欢我们在本书中对这个词的使用,那就用“好的思维”(good thinking)这个说法吧,这么做也没有任何问题。1 严谨的理性定义本书所使用的严谨的“理性”定义“理性”一词有严谨和宽泛两种定义。人们对理性都有常识性的理解,但如果采用宽泛的定义,非专业人士和学者常常会产生分歧。而实证科学家更倾向对理性采用严谨的定义,特别是在认知科学领域。本书主要采用的是严谨的定义。相比之下,字典中对理性的定义往往是宽泛的,相当蹩脚且不具体,例如,“与理由相一致的状态或性质”。理性的宽泛定义来源于亚里士多德提出的绝对理性分类(categorical)概念,他认为人类是唯一有理性的动物。正如德苏萨(de Sousa,2007)所指出的那样,理性的对立面不是非理性,而是没有理性。亚里士多德对理性的理解是绝对化的:一个有机体的行为要么是基于理性的,要么是没有理性的。按照这种理解,人类是理性的,其他动物是没有理性的,人类在理性思维方面没有个体差异。理性的严谨定义主要在认知科学和本书中使用。认知科学中所采用的最优判断和决策规范模型使理性的定义非绝对化,这种定义下的理性取决于思想或行为与最优模式之间的距离(Etzioni,2014)。因此,当认知科学家将一种行为称为非理性行为时,他的意思是指该行为偏离了特定规范模型所规定的最佳行为,而并不是在暗示这种行为背后没有任何思想或推理。人们对人类非理性研究的敌意,无疑源于上述亚里士多德的观点:当认知心理学家认为某些人出现非理性行为时,似乎就等于在说这些人不是人。因此,在民间语言中,“非理性”(irrationality)一词被认为是一种特别严重的侮辱。我们要指出的是,心理学家并没有这样使用这个词,他们对理性采用了不同的定义,在这一定义中,人都是完全的人,但理性倾向存在差异。对于民众来说,亚里士多德对理性绝对化的定性观点会使他们将“非理性”一词理解为尖锐的讽刺。但认知科学家对理性的理解是非定性的量化观点,是从“理性”到“非理性”连续的(continuous)变化过程。当我们发现一种行为模式比最优模式差时,我们会说其“未达到最优理性”,而不是说它是没有理性的,这才是对“非理性”一词应有的理解。如果认知科学家对非理性的定义是民众的通识,认知科学界也就不必花如此大的力气为其辩护了(Bishop & Trout,2005;Cohen,1981;Kelman,2011;Stanovich,1999,2004;Stein,1996;Tetlock & Mellers,2002)。也正因为如此,本书将非常谨慎地使用“非理性”一词,我们关注的是理性反应的连续性变化,即从完全理性到理性逐渐减少的变化。心理学家不接受定性的理性概念的另一个原因是,这种定义没有为认知改善提供动力。理性的定量定义可以促进认知改善,因为大多数人都没有达到完全或最优的理性,而且理性思维倾向是可以改善的。采用认知科学对理性的定量定义,虽然可以推动认知改善,但必须要承认一些人比另一些人更理性(至少从完成各项测验的表现上看确实如此)。这和说一些人比其他人更聪明没有什么区别。理性上的差异是与智力差异相互重叠但又截然不同的认知领域。人们确实在智力上存在差异,并且心理学家有能力测量这些差异,设计出提升智力的方法。同样,人们在理性上也存在差异,认知科学也已经发现了许多方法可以使人们变得更加理性,从而使他们在生活中获得更好的结果。例如,我们可以教人们做出更好的经济决策,教医生做出更好的医疗决定,向教育工作者提供做出更好教育决策的建议。1.2  工具性理性与认识性理性如前所述,字典中关于理性的定义(“依据理由行动”)往往很宽泛,不具体,因而无法测量。此外,由于种种原因,一些学者为了弱化理性的重要性,常常对理性的概念冷嘲热讽。一种常见的说法是,理性仅仅意味着解决诸如哲学入门书中遇到的三段论推理(syllogistic reasoning)问题的能力。其实,在现代认知科学中,理性的含义更为全面、确定和重要。我们综合许多认知科学理论家的说法后认为,理性包括两种类型:工具性理性和认识性理性(Manktelow,2004;Over,2004)。工具性理性(instrumental rationality)最简单的定义是:在现实世界,根据给定的资源(身体的和精神的),采取行动得到最想要的结果。更学术的说法就是:个人目标实现最优化。经济学家和认知科学家又将目标实现最优化的概念转化为期望效用的学术概念。认识性理性(epistemic rationality)关注的是我们的信念如何映射出现实世界。认识性理性有时被哲学家称为“理论理性”或“证据理性”。同样,工具性理性有时被称为“操作理性”。当然,这两种类型的理性是相关的:为了通过行动来实现我们的目标,我们需要把这些行动建立在与现实世界正确匹配的信念之上。当认识性理性和工具性理性被合理定义后,人们就愿意使用这两个概念了。大多数人都希望他们的信念与现实相符,也希望自己的行为有助于个人目标的实现。曼克特洛(Manktelow,2004)指出这两种理性概念非常实用,主要涉及两个关键问题:“何为真”及“做什么”。认识性理性是关于“何为真”的,工具性理性是关于“做什么”的。要想让我们的信念是理性的,它必须与现实世界保持一致,即信念必须为“真”;要想让我们的行动是理性的,必须用最佳方法来实现我们的目标,即做“佳”的事。对于人们的生活来说,没有什么东西比能够找到“真”和“佳”的思维更实际和更有用的了。经济学家和认知科学家进一步将工具性理性定义为期望效用的最大化(maximizing expected utility)。要实现工具性理性,一个人必须在选项中选择具有最大期望效用的那个选项。决策情境一般可分解为三个部分:①可能的行动;②世界的可能状态;③对每种可能状态下可能行动的后果评估。期望效用的计算方法是将每个可能的结果的效用乘以该结果发生的概率,然后求和。1.3   理性选择的公理化方法在实践中,用这种计算方式来评估理性是很难实现的。首先,探查个人的各种结果概率是很困难的。其次,测量各种后果的效用在技术上难以实现。幸运的是,还有另一种有用的方法可以衡量决策的合理性和偏离理性的程度。通过一些严谨的分析已经证明,如果人们的偏好遵循某些一致的模式(即所谓的选择公理(axioms of choice)),那么他们的行为就近似于效用最大化(Dawes,1998;Edwards,1954;Jeffrey,1983;Luce & Raiffa,1957;Savage,1954;von Neumann & Morgenstern,1944)。这种分析人们是否最大化效用的方法被称为“公理化方法”。这种方法使我们能够更容易地通过认知科学的实验方法来衡量人们的理性程度。依据公理测量对最优选择模式的偏离程度是一种评价理性程度的反向度量方法,即越偏离最优选择模式,人的理性就越低。基于公理化方法,工具性理性被定义为对具有连续性和一致性的标准的坚持。例如,传递性公理是:如果你喜欢A超过B,喜欢B超过C,那么你应该更喜欢A而不是C。违背传递性是对理性的严重违反,因为它可能导致决策理论家所说的“金钱泵”(money pump)现象。在某些情境下,如果你按照这种非传递性偏好行事,你将会耗尽你所有的财富(Schick,1986)。根据公理化方法的分析,最大化效用的人应对决策情境中的每个选项具有稳定的、潜在的偏好。一个具有完美理性的人应对可能选项的偏好是坚定的、有序的,并坚持公理(Thaler,2015)。所有决策公理(无关备择选项独立性、传递性、独立性、复合彩票简约化公理等)都是以某种方式来确保决策不受无关背景的影响(Stanovich,2013)。因为每一种偏好的强度(该选项的效用)都存在于大脑中,甚至在选项出现之前就已经存在了,选项呈现时的任何背景信息都不应影响偏好。如果我们的偏好受到无关背景的影响,我们的偏好就不可能是稳定的,我们也不能最大化我们的效用。因此,我们的思维在多大程度上独立于不相关的背景是衡量理性思维的一个重要标准,这个标准也在我们的评估工具中占有突出的地位。认知科学中有大量的实证证据表明,人们有时会违反这些效用理论的公理(Kahneman & Tversky,2000;Thaler,2015)。实际上,从坚持最基本公理的视角来看,人们在工具性理性上的个体差异很大。我们也可以用公理化的方法来评估认识性理性。回想一下,一个行动的期望效用是将每个结果的概率乘以它的效用,并对可能的结果进行求和。因此,确定最佳行动需要估计各种结果的概率。当然,这些概率不是有意识的计算,而是我们对世界状态的可信估计,取决于我们的信念和对这些信念的确信程度。如果我们对世界状态的概率判断是错误的,那么决策就不会使我们的效用最大化,我们的行动也不会让我们得到最想要的结果。因此,工具性理性和认识性理性是交织在一起的。如果我们要决定该做什么,我们需要确保我们的行动建立在“真”的基础上。从这个意义上说,信念的理性(认识性理性)是行动理性的基础之一。信念的理性是通过各种与概率有关的推理技能、证据评估技能和假设检验技能来评估的。一个人要想具有认识性理性,他的概率估计必须遵循客观概率规则。也就是说,他的估计必须遵循所谓的概率计算。从数学上讲,概率估计值应遵循特定的规则。这些规则构成了主观概率估计最重要的规范模型。与工具性理性一样,认知心理学的重要发现之一就是发现人们常常会违反各种认识性理性的规则。1.4  理性、启发与偏差文献在构建我们的理性思维评估工具时,我们借鉴了大量研究违反工具性理性和认识性理性规范模型的文献。这些跨度几十年的数以百计的实证研究有力地证明了,人们在许多推理任务上表现出对规范模型的偏离,如:人们对概率的评估不正确,对假设的检验效率不高,违反了效用理论的公理,没有合理地校准信念,选择受到无关背景的影响,在评估数据时忽略了替代假设,以及许多其他信息加工偏差(Baron,2008,2014;Evans,2014;Kahneman,2011;Kahneman & Tversky,2000;Koehler & Harvey,2004;Manktelow,2012;Thaler,2015)。我们大量借鉴了这些研究,特别是由卡尼曼和特沃斯基于20世纪70年代初开创的启发与偏差研究(Kahneman & Tversky,1972,1973;Tversky & Kahneman,1974)。“偏差”(bias)一词指的是人们在选择行动和估计概率时所犯的系统性错误,而“启发”(heuristic,又译“启发式”)一词是指人们经常犯这些错误的原因,因为他们使用心理捷径(启发)来处理许多问题。我们将用几个章节来讨论有关这些心理捷径的心理学理论。表1-1列出了我们实验室研究过的一些任务、效应和偏差,并由此构建了我们的理性思维综合评估测验(CART)。表1-1 斯坦诺维奇、韦斯特和托普拉克实验室对启发与偏差任务中个体差异的研究列表

几乎所有的心理学研究者都承认获2002年诺贝尔经济学奖的工作——启发与偏差在认知领域的重要性。颁奖委员会将奖项授予丹尼尔·卡尼曼的根本原因之一是“认知心理学家对人类判断和决策的分析”。这项工作“激励新一代经济学研究者,利用认知心理学的方法去剖析人类的内在动机,从而丰富了经济理论”(The Royal Swedish Academy of Sciences,2002a,2002b)。这个方向的研究之所以如此有影响力,原因之一在于它涉及与人类理性有关的深层次问题。正如诺贝尔奖公告所指出的那样,“卡尼曼和特沃斯基发现了不确定性下的判断如何系统地脱离了传统经济理论中假定的那种理性”(The Royal Swedish Academy of Sciences,2002a,2002b)。理性意味着用最好的手段来实现自己的人生目标,卡尼曼和特沃斯基发现的思维错误不仅能够影响游戏结果等微不足道的问题,更关键的是,如果我们违反了这些被诺贝尔奖认可的思维规则,我们的实际生活就无法达到自己的满意状态。认知科学家斯蒂芬·平克(Steven Pinker)也认同诺贝尔奖委员会的观点,他认为“当试图在整个人类知识体系中找出受教育的人应该知道的知识时……有关人类认知和概率推理的知识应包括在其中,这是每个受过教育的人首先应该知道的事情之一,但出于尊敬,我没有资格评价这项工作是多么的重要”(Creative Leadership Forum,2011)。我们同意平克的观点,即这些思维领域的知识是每个受过教育的人都应该知道的,他的这番话可以让我们换一个思路来看待我们在CART中所创造的东西。平克提到的“任何受过教育的人都应该知道的知识”正是我们试图评估的东西!判断和决策技能是理性思维和行动的基础,但智力测验并没有考察这部分。这本书,以及我们构建的评估工具,正是对这一对行为科学领域影响深远的历史性遗憾的部分补救:卡尼曼正是由于对被行为科学中最著名的心理评估工具(智力测验)所完全遗漏掉的认知特征的研究而获得了诺贝尔奖(Stanovich,2009)。我们希望CART至少能在一定程度上调整人们的关注点,对我们的学科领域予以足够的关注。由于我们的理性思维框架的可操作化很大程度上来自于传统的启发与偏差研究,因此,从当代人类思维功能结构的角度来解释各项认知任务的逻辑是很重要的。在下一章中,我们将概述功能性认知理论,并使用这些理论来解释本书中各项任务。在第三章中,我们将阐述我们的测验体系中采用的启发与偏差任务的逻辑。一旦读者理解了我们的测验体系,就不难理解本书前言中的关键点了。特别是我们将阐述理性和智力这两个概念以及二者的区别。我们将进一步证明理性实际上是比智力内涵更广的心理结构概念。因此,启发与偏差任务作为测量理性的方法,实际上比智力测验测量了更多的认知过程和知识。1.5   小结理性是一个跨越许多学科的概念,因此它有许多不同的定义。其中一些定义实际上阻碍了评估判断和决策这两项重要认知能力的个体差异这一目标的实现。因此,我们选择了认知科学领域对理性的定义,这有助于我们测量理性的个体差异。这个领域的定义是基于实证研究的,我们及大多数认知科学家的研究都表明,用这些定义和方法来测量理性时,能够发现大量的个体差异。关于我们的逻辑的另一种表述是,如果你要测量个体在理性思维上的差异,你就必须用我们的方式来定义它。任何研究者都可以自由地以其他方式定义理性,但我们所研究的个体差异仍然不会消失,我们只需要换个名词来表述这些差异即可。从某种意义上说,我们不反对其他定义,而只是想表明我们的主张。任何反对我们用一大堆启发与偏差任务来测量“理性”的人,也绝对不应将这些方法视为智力测验的一部分。这些方法不是来自于现有的智力测验,智力测验不能有效预测推理过程中的个体差异。因此,我们将我们的测验称为一种测量理性思维的方法。或者正如我们将在第二章中要讨论的那样,我们实际上是在测量智力以外的东西——只要别管它叫“智力”就好。第二章 理性、智力和心智的功能结构对智力概念的讨论往往暗含着智力测验对心智能力评价的特权,非专业人士往往不能立即察觉这点。发生这种情况的主要原因之一是,在讨论智力概念之前,完整的人类认知模型往往没有先被阐明。在没有这样一个完整模型的情况下,外行人自然会认为智力测验测量了所有重要的认知特征。简而言之,对智力的讨论由于没有建立在认知功能的一般模型之上,因而往往在一开始就偏离了轨道,进而导致了默认的假设,即智力测验测量了心智功能的所有关键特征。鉴于此,本章首先勾勒出有关智力的共识观点;然后,努力将智力置于一个完整的认知模型中;最后,通过将智力和理性放在统一的完整模型中,来阐明为什么理性实际上是一个比智力更具内涵的概念,同时批驳了许多流行的观点。2.1  智力的理论基础在前言中,我们介绍了智力的宽泛定义和严谨定义之间的区别。民众所理解的智力包括了多种能力,如适应环境的能力,但智力测验并未实际测量这种能力。与此对比,严谨的智力定义将智力的概念局限于“通过现存的智力测验所测量出的一组心理能力”。我们在本书采用智力的严谨定义,并在讨论中提供已有智力测验的统计数据和各种认知能力指标(Deary,2013)。智力领域最具影响的严谨理论是卡特尔–霍恩–卡罗尔 智力理论 。1这个理论提出了一般智力 的科学概念,通常用“g”表示,并包含几个一般因素,其中两个占主导地位。一个因素是流体智力(Gf),代表跨领域(包括新异领域)的推理能力。它是通过抽象思维测验来测量的,如类比测验、瑞文测验、填补数列(如,数列1,4,5,8,9,12,__中的下一个数是什么)。另一个因素是晶体智力(Gc),反映了从文化适应中习得的陈述性知识。它可通过词汇任务、语言理解和一般知识测验来测量。尽管两者之间关系密切,但Gf和Gc反映了长久以来人们对智力认识的两个方面:加工智力和知识智力 。除了Gf和Gc之外,其他一般因素还有记忆和学习、听觉感知和加工速度等 。关于CHC、Gf和Gc有非常多的文献 。该理论的结构已在脑损伤、教育成就、认知神经科学、认知发展趋势和信息加工的研究中得到验证。当然,除CHC外,还有其他一些替代模型 。例如,亨特 对g-VPR模型 替代CHC模型的可能性进行了实证探讨。然而,通过将智力与理性从理论上进行比较就不难发现,无论采用哪种智力的严谨定义对我们来说都没有区别,因为这些理论都忽略了对理性的认知分析。2.2  双过程理论:通往认知结构模型的第一步正如前一章所讨论的,认知心理学文献中的启发与偏差任务在很大程度上形成了认知科学中对理性思维的操作定义。这些研究通常基于双过程框架来定义理性。大多数启发与偏差任务往往被特意设计为由一个被自动触发的反应和一个与之拮抗的规范反应构成,这两个反应通常(但并非总是2)由多个受控制的心理过程产生 。自从卡尼曼和特沃斯基在20世纪70年代创造了启发与偏差范式以来,相关研究领域已经积累了海量的支持双过程范式的证据 。各种各样的证据汇集在一个结论上,即在不同的专业领域都会需要某种类型的双过程概念,这些领域包括但不限于:认知心理学、经济学、社会心理学、自然主义哲学、决策理论和临床心理学 。此外,进化理论和神经生理学的研究也支持双过程理论 。由于现在有太多的双过程理论(双过程理论各种版本的清单,见Stanovich,2011,2012),研究人员对这两个过程的命名往往存在很大差异。基于本书的初衷,我们主要采用埃万斯和斯坦诺维奇(Evans & Stanovich,2013)提出的命名:类型1和类型2,偶尔也会使用斯坦诺维奇(Stanovich,1999)和卡尼曼(Kahneman,2011)提出的命名:系统1和系统2。3类型1过程的典型特征是自发式的,类型1过程在遇到触发刺激后自动出现,不受高级控制系统的影响。自发过程还有其他一些非典型特征,如执行很快,不增加中央加工过程负荷,往往是关联式的(Stanovich & Toplak,2012)。自发过程包括:情绪调节过程,进化心理学家提出的解决特定适应性问题的“封装模块”,内隐学习过程,以及自动触发的过度学习联结(Barrett & Kurzban,2006;Carruthers,2006;Evans,2008,2009;Moors & De Houwer,2006;Samuels,2005,2009;Shiffrin & Schneider,1977)。类型1过程的不同表现形式清楚地表明其是一个复合体,既包括天生固有的模块或过程,也包括了后天经验习得的自动化关联和固着行为。类型1过程的很多表现虽然在神经生理学和病因学上可能有很大的不同,但共性是都具有自主性。必须强调的是,类型1过程不限于福多里安(Fodorian,1983)提出的标准的模块过程(Stanovich,1999),无意识的内隐学习和条件反射,以及自动化加工的许多规则、刺激判别和决策原则也属于类型1过程(Kahneman & Klein,2009;Shiffrin & Schneider,1977)。这些习得的模式有时会妨碍人类的理性行为,这些进化模块也会导致人类在现代环境中出现不合理的反应。习得的自动化规则经常会被过度使用,即当情境与通常状况不同时,仍可自动触发习得行为(Arkes & Ayton,1999;Hsee & Hastie,2006)。与类型1过程不同,类型2过程更慢,更需要消耗计算资源。许多类型1过程是平行加工的,而类型2过程很大程度上是序列加工的。类型2过程最重要的功能是对类型1过程的压制(override)。由于自发过程往往具有启发式特点,因此压制功能有时是非常必要的。自发过程适合于相对容易的问题解决和决策情境,但不适合于处理一些需要深思熟虑的重要情境,如经济决策、公平判断、雇用决定、法律裁决等。类型1的启发式过程适用于良性(benign)环境,而且在有明显信息线索时,可以引发适应性行为。然而在恶性(hostile)环境中,依赖启发式会让人付出代价(Hilton,2003;Over,2000;Stanovich,2004)。良性环境是指包含有用(特征性)线索的环境,这些线索可以被各种启发式方法利用,如情感触发线索、鲜活突出的刺激、便利而正确的锚定点等。此外,要界定环境是良性的,还需要确保没有人操纵决策者使用类型1过程。相反,不适合采用启发式的恶性环境是指环境中缺乏可利用的线索,或者有误导性的线索(Kahneman & Klein,2009)。当一些机构故意利用一些明显线索来诱导受众使用类型1过程时,这种情境也属于恶性环境。例如,在广告或超市设计策略中,商家常常诱导消费者采用类型1过程,以使盈利最大化。所有不同形式的类型1过程(情绪调节过程、进化模块、联想和内隐学习过程)如果不被压制,都将在特定的环境中产生非最优反应。例如,人类经常通过属性替换(attribute substitution)使自己成为“认知吝啬鬼”(cognitive misers)(关于这一概念的进一步讨论见第三章;Kahneman & Frederick,2002),也就是将难以评估的属性替换为容易评估的属性,如将那些难以评估的重要事实替换为鲜活的、情感性的、易于评估的属性,即使容易评估的属性是错的,人们也会这么干(Kahneman,2003;Li & Chapman,2009;Slovic & Peters,2006;Wang,2009)。但是,当我们在评估重要的风险时,如某些活动和环境给我们的孩子带来危险时,我们就不想用鲜活性来代替对情况的仔细思考了。在这种情况下,我们希望使用类型2过程压制“认知吝啬鬼”的属性替换,这是检测到认知去耦(cognitive decoupling)需求的重要加工过程,关于这点,我们将在下一章中详细讨论。当检测到规范反应与类型1过程所触发的反应之间的冲突时,类型2过程必须具有至少两个相关功能,才能压制类型1过程:其中之一是中断类型1过程的能力,即类型2过程必须包含抑制功能,抑制功能一直是执行功能的核心(Best,Miller,& Jones,2009;Hasher,Lustig,& Zacks,2007;Miyake & Friedman,2012)。但压制类型1过程仅仅是一半的工作,如果没有更好的反应来替代类型1过程,压制过程也是没有意义的。更好的反应从何而来?一个答案是来自假设推理和认知模拟过程,这是类型2过程的特有方面(Evans,2007a,2010;Evans & Stanovich,2013)。当我们假设推理时,我们创建了世界的临时模型,并在这个模拟世界中检验我们的行动或其他可能性。然而,为了进行假设推理,我们还必须具备一种批判性认知能力——必须能够防止我们把现实世界的表征与想象世界的表征相混淆,这一所谓的认知去耦操作(Stanovich,2011)是类型2过程的核心特征,同时也影响到我们后面如何定义智力和理性。当进行模拟时,我们最重要的目的是引起类型2过程,即引起和保持来自对现实世界的次级表征去耦。认知去耦具有耗能的算法特性,同时也显著限制了其他类型2过程。事实上,去耦操作很可能是类型2过程的最主要特性——串行性的最重要影响因素。图2-1是我们前面概述的双过程模型的示意图。图中显示了我们已经讨论过的类型2过程的压制功能和模拟过程。从类型1过程到类型2过程的箭头表示类型2过程接收类型1过程的信息输入。前注意过程(Evans,2008)形成了大多数类型2过程的加工内容。

图2-1 初始双过程模型2.3  将智力纳入双过程模型智力在这个模型中的位置如何?首先,我们必须考虑到智力的个体差异研究是智力研究的最重要部分。类型1过程尽管是认知的一个重要组成部分,但其个体差异可以忽略不计。类型1过程帮助我们执行大量有用的信息加工操作和适应行为(如深度感知、人脸识别、频率估计、言语加工、威胁监测、情感反应、颜色感知)。然而由于人类在大多数类型1过程中的个体差异不大,这就导致了在认知科学中使用“智力”概念容易产生矛盾和混乱。当你阅读关于认知科学的一篇文章或一本教科书时,常常会读到有关我们识别面孔的奇妙机制的描述,并被称为“人类智力的一个伟大方面”;同样,一本科普书可能会描述我们如何在处理语言时拥有语法解析机制,并将此称为“人类智力进化的非凡产物”;一本关于进化心理学的教科书可能描述了包括人类在内的许多动物所具有的神奇的亲属识别机能。面部识别、句法处理、亲属识别等机能都是大脑机能的一部分,有时也被描述为人类智力的一部分。然而,这些机能却没有被智力测验所测量。因此我们非常有必要提醒学界:智力测验只评估存在显著个体差异的认知功能。智力测验有点像交友网站上的列表,只关心人和人的区别,而不关心人和人的相似之处。这就是为什么那些列表中只包含诸如“喜欢听摇滚音乐”之类的题目,而没有“在饿的时候我喜欢吃东西”这样的题目。由于这个原因,智力测验并不关注大脑自主的类型1过程。4智力测验的Gf(流体)成分,主要考察类型2过程。在很大程度上,智力测验考察的是这一节中我们一直强调的认知去耦能力。认知去耦操作可以让人们开启假设思维。人们必须一直保持认知去耦才能保证心理模拟的顺利进行,在维持心理模拟时所用到的保持相关表征去耦的原始能力是大脑计算能力的一个关键方面,这也是测量流体智力时所实际评估到的东西。越来越多的证据表明执行功能和工作记忆两者与流体智力具有相当高的相关性 。这是因为执行功能的大多数测量方法,如工作记忆,都直接或间接地表明了个体维持去耦操作的能力 。因此,类型2过程与流体智力是紧密联系的 。我们稍后会将晶体智力引入模型,但先讨论另一个更重要的难点。2.4  三重心智模型在前言中,我们提出如果我们能正确理解智力和理性之间的区别,那么聪明人做傻事的情况就不会令人太吃惊了。本章我们将解释原因。解释的第一步,是理解理性思维涉及大脑层级控制系统中的一个水平,而这一水平仅被智力测验十分有限地进行了评估。要理解这一点,就需要理解对自主的次级系统压制的逻辑,具体来说,即理解压制需要在两个水平的加工中被概念化。下面通过两个虚构的故事来更直观地理解这两个水平。这两个故事都是关于一个女人沿着悬崖边走,然后死亡的伤感故事。这两个故事的目的是让我们思考如何解释每一个故事中的死亡事件。在事件A中,一个女人沿着海边的悬崖走着,试图跳上一块大岩石,但是这个看起来像岩石的东西根本不是一块岩石,而是一个断崖,她从断崖上跌落下去,死掉了。在事件B中,一个女人从海边的悬崖上跳下自杀,最后死掉了。在这两种情况下,在最基本的层面上,当我们要求自己对这两个女性死亡的原因做出解释时,我们可能会说是一样的。在事件A中运行的物理定律(描述女人为何在引力的影响下受到撞击的引力定律)与事件B中运行的相同。但是,我们认为引力和力的定律在某种程度上不能完整地解释这两个故事中发生了什么。此外,当我们尝试进行更细微的解释时,如果对死亡的基本原因进行详查,事件A和事件B似乎需要不同水平的解释。在分析事件A时,心理学家会倾向于说,在对刺激(看上去有点像岩石的断崖)进行加工时,该女性的信息处理系统出现了故障,将错误的信息发送到反应决策系统,从而导致灾难性的动作反应。我们将这一水平的分析称为“算法层级”。5这类似于在计算机科学中,用抽象语言(BASIC语言、C语言、Java语言等)编写计算机程序的指令层级。认知心理学家在这一层级上的工作主要是通过在大脑中构建特定的信息处理机制(输入编码机制、知觉登记机制、短时和长时记忆存储系统等)来解释人类的表现。例如,一个字母发音的简单任务可能需要对字母进行编码,将其存储在短时记忆中,然后将其与存储在长时记忆中的信息进行比较,如果匹配,则做出反应决策,最后执行动作反应。就事件A中的女性而言,算法水平是解释她不幸死亡的正确水平。她的知觉登记和分类机制出现故障,向反应决策机制提供了不正确的信息,最终导致她坠落断崖。然而,事件B不涉及这种算法层级的信息处理错误。这位女士的感知准确地识别了悬崖的边缘,她的运动指令中枢非常准确地指挥她的身体跳下悬崖。运算过程从算法层级水平来看相当完美。在这一层级的分析中,无法解释何种错误导致该女性在事件B中死亡。相反,这位女性的死亡是因为她的总体目标,以及这些目标与她对自己所处世界的信念的相互作用。1996年,丹尼尔·丹尼特(Daniel Dennett)出版《心灵种种》(Kinds of Minds),他通过这个书名想表达人类的大脑是由多种类型和模式的意识所控制的。我们基于这本书的思想构建了我们的认知结构模型(Stanovich,2011)。用我们的术语来说,事件A中的女性在算法心智(algorithmic mind)上有问题,而事件B中的女性是在反思心智(reflective mind)上出了问题。6这些术语表明:我们需要转向对目标、欲望和信念的分析才能理解像事件B这样的案例。算法层级对案例事件B这种情况下的行为提供了一个不完整的解释,因为它只提供了关于大脑如何执行特定任务的解释(本例中从悬崖上跳下),但没有解释为什么大脑要形成这一特定任务。当我们探求系统运算的目标(系统试图运算什么,为什么要如此运算)时,我们就需要转而关注反思心智层级了。简而言之,反思心智关注的是系统目标和与这些目标相关的信念,以及基于系统目标和信念的最佳行动选择。所有这些都涉及反思心智的许多理性问题。总之,算法心智的高效能不是理性的充分条件。我们进一步区分类型2加工中所涉及的控制水平,创建了三重心智模型(tripartite model)理论,如图2-2所示。在这个理论中,心智有三个层级:自主心智(autonomous mind)、算法心智和反思心智。心理学文献提供了大量的证据和理论来支持这种结构。首先,心理测量学家长期以来就将测量情境分为典型(typical)行为情境与最佳行为(optimal performance,有时称为“最高”)情境(Ackerman & Kanfer,2004;Cronbach,1949;Sternberg,Grigorenko,& Zhang,2008)。典型行为情境对行为反应是没有限定的,因而也没有明确的最大化要求,对任务的理解在一定程度上由被试所决定,任务要求具有某种程度的开放性。其中的关键是一个人在特定情境下通常会做些什么,没有限定。典型行为的测量至少在一定程度上涉及反思心智,包括评估目标优先次序和认知调控。相反,最佳行为情境的任务由外部标准确定,执行任务的人被要求展现出最佳行为。因此,最佳行为任务评估的是达成目标的效能,即算法心智的效能。所有智力或认知能力测验都是最佳行为评估,而批判性或理性思维的评估往往是基于典型行为条件做出的。

图2-2 三重心智模型和个体认知差异关键点算法心智和反思心智之间的区别体现在另一个公认的个体差异测量中,即认知能力和思维倾向之间的区别。正如刚才提到的,前者主要测量算法心智效能,后者在心理学上有不同的名称,其中“思维倾向”(thinking disposition)或“认知风格”(cognitive style)是最常见的。思维倾向包括信念、信念结构,特别是对形成和改变信念的态度。其他一些思维倾向与个人目标和目标层次有关。心理学家研究过的思维倾向主要有:积极开放思维(actively open-minded thinking,AOT)、认知需求(need for cognition,NFC)、对未来后果的关注(consideration of future consequences)、封闭需求(need for closure)、教条主义(dogmatism)等(Baron et al.,2015;Cacioppo et al.,1996;Kruglanski &Webster,1996;Schommer-Aikins,2004;Stanovich,1999,2011;Sternberg,2003;Sternberg & Grigorenko,1997;Strathman et al.,1994)。这些思维倾向所反映出的认知倾向包括:在下决心前收集信息的倾向,在得出结论前寻求各种观点的倾向,在做出反应之前深入思考问题的倾向,根据证据的强度对自己的意见强度进行校准的倾向,在采取行动之前考虑未来后果的倾向,在决策前仔细权衡各种情况利弊的倾向,以及寻求细微差别和避免绝对主义的倾向。简单地说,个体思维倾向的差异反映了人们在目标管理、价值认识和自我认知调节方面的差异,即在反思心智上的差异。智力测验评估的认知能力与上述内容不是一种类型。智力测验没有评估高层次的个人目标和管理状况,没有评估当面对相反证据时改变信念的倾向,也未评估在没有外部指导的情况下如何通过自我管理来获取知识的状况。人们确实曾经想构建包含这些内容的智力的定义,一些宽容的理论家(见本书前言)通常在定义智力时包含了理性行为和信念,但遗憾的是,智力测验在实际测量智力时只是评估了算法层级的认知能力。图2-2表示三重心智模型视角下个体差异的分类。其中的水平虚线代表与旧的双过程视角的关键区别。图2-2还展示了流体智力上的个体差异主要由算法心智处理效能上的个体差异所引起。我们前面指出过,流体智力是反映在压制和维持去耦操作上个体差异的一个关键指标。而反思心智反映的是,与信念和目标相关的思维倾向上的个体差异。2.5  三重心智模型以及为何理性比智力的内涵更广图2-2凸显出的重要意义是:理性比智力的内涵更广。正如前面讨论过的,要想变得理性,一个人必须有精准的信念,并依据这些信念采取适当行动以实现目标。这两方面都是反思心智的特征。当然,人们还必须拥有良好的算法心智,以使自己能够以坚定、正确的信念和适当的行动方式应对环境。因此,正是由于流体智力(算法心智)的个体差异或思维倾向(反思心智)的个体差异才导致了不同个体在理性思维和行动中的差异。简单地说,理性的概念包括两个要素:思维倾向和算法层级的能力,而智力的概念,特别是从操作性上讲,主要反映的是算法层级的能力。智力测验既不能测量认识性理性或工具性理性,也不能检测任何与理性相关的思维倾向。从图2-2中可以清楚地看出,为什么理性和智力可以分离开来。理性思维既取决于我们的思维倾向,也取决于我们的算法效能。因此,只要思维倾向的变异与流体智力的变异不完全相关,那么就有可能在统计学上区分理性和智力。事实上,大量的实证证据表明,个体在思维倾向和智力方面的差异的相关性并不大。很多研究(Ackerman & Heggestad,1997;Cacioppo et al.,1996;Kanazawa,2004;Zeidner & Matthews,2000)表明,智力测验分数与某些思维倾向,如积极开放思维、认知需求等只有中到低等程度(通常相关系数低于0.3)的相关,与其他一些思维倾向,如尽责性、好奇心、勤奋性的相关系数接近0。另外一些研究为算法心智和思维倾向是不同的心理特性这一论点提供了有力证据。例如,在启发和偏见研究文献中的各种任务中,研究者们一致发现,在控制了一般智力的影响之后,理性思维倾向可预测决策结果的变异(Bruine de Bruin,Parker,& Fischhoff,2007;Finucane & Gullion,2010;Klaczynski & Lavallee,2005;Kokis et al.,2002;Macpherson & Stanovich,2007;Parker & Fischhoff,2005;Stanovich & West,1997,1998c;Toplak et al.,2007;Toplak & Stanovich,2002;Toplak,West,& Stanovich,2011,2014a,2014b)。准确理解思维倾向的概念才能够真正理解CART的内容。反思心智的思维倾向是理性思维的心理基础。最大化这些思维倾向并不是理性思维本身的标准,理性应是通过优化信念与证据间的契合度,以及用明智的决策来最大化地实现目标。反思心智的思维倾向是实现个体目标的一种手段。许多高水平的思维倾向,如高谨慎性和高信念灵活性对于理性思维和行为来说是必要的,但这并不一定意味着水平越高越理性,其中应该有一个平衡点。比如,一个人不能无限度地扩大思考的范围,否则他就会迷失在没完没了的思考中,永远不会做出决定;同样,一个人也不能无限度地提高信念的灵活性,因为这样的人最终可能会陷入病态的不稳定人格之中。但一般来说,谨慎性和信念灵活性是“好的”认知风格,因为大多数人在这些维度上的表现都不够高,所以一般“更高”会更好(Baron,1985,2008),但没必要最大化。出于这个原因(其他原因见第十一章),思维倾向分测验在CART中只是补充测验,而不被当成直接测量理性思维的方法。2.6  完整版三重心智模型图2-3更完整地说明了不同水平的认知功能以及相互控制的关系。箭头A清楚地表明了压制能力本身也是算法心智的一个属性。然而,以前的双过程理论倾向于忽略最初启动压制功能的更高层次的认知加工。压制功能的启动是与理性相关的反思心智的一种配置属性。在图2-3显示的模型中,箭头B表示反思心智发给算法心智的指令,指示算法心智通过让类型1反应离线来压制其反应。这是一种不同于压制过程本身(箭头A所代表的)的另一过程。前面引用的证据表明,这两种过程可以反映出不同类型的个体差异。

图2-3 更完整的三重心智模型压制功能在双过程理论中地位凸显,以至于在一定程度上让人忽视了心理模拟过程。正是对备择反应进行计算的心理模拟过程才真正体现出了压制过程的重要性。因此,图2-3清楚地标明了心理模拟功能,以及反思心智发起心理模拟的路径。去耦加工(用箭头C表示,分离对现实的心理模拟与现实本身的过程)由算法心智执行。反思心智给算法心智发出启动模拟的指令(用箭头D表示)。个体差异主要体现在发起去耦和去耦加工两方面。具体而言,思维倾向与发起去耦有关,流体智力与去耦加工有关。算法心智还通过前注意加工(箭头G)接收来自自主心智的指令,对其进行高级控制(Evans,2006,2009)。箭头E和箭头F表示去耦加工和对某一种类型2的高级控制过程(串行联想认知,serial associative cognition),不包括完全显性心理模拟(Stanovich,2011)。这些认知过程是缓慢的、串行的,不涉及对备择情境的模拟和详尽探索。这些过程的存在表明了一个重要的事实:所有假设性思维都涉及类型2加工(Type 2 processing)(Evans & Over,2004),但不是所有的类型2加工都包括假设性思维。串行联想认知属于后一种类型的类型2过程。类型1过程包括:情感反应、通过先验学习而形成的自动反应、条件反射,以及由进化形成的适应性模块。这些机能可以使人类应对许多情况,但现代生活中仍然有许多问题是这些机能不能解决的。虽然有许多人对现代认知心理学中使用的实验室任务的有效性提出批评,但我们的观点是,这些任务很好地模拟了现代社会新出现的问题情境(Stanovich,2004)。比如,沃森(Wason,1966)的四卡片选择任务(four-card selection task),引出了大量的研究和成果(Evans,2014;Evans,Newstead,& Byrne,1993;Stanovich,1999;Stanovich & West,1998a)。这个任务提供了一个绝佳的情境来考察个体是通过串行联想认知模式,还是通过认知模拟来详尽探索各种备择可能性。对这个任务的抽象版本的表述通常如下。桌子上有四张卡片,规则是:“每张卡片一面写有一个字母,另一面写有一个数字,如果卡片的一面是元音字母,那么另一面就是偶数数字。”其中有两张卡片是字母面向上,另两张卡片是数字面向上。被试的任务是确定必须翻看哪一张或哪几张卡片,才能确定规则正确与否。呈现给被试的四张卡片分别是K、A、8和5。正确答案是A和5,只有翻看这两张卡片才能确定规则正确与否。然而,大多数被试错误地认为应翻看A和8,即表现出了所谓的匹配偏差(matching bias)。埃万斯(Evans,2006)指出,由于先前的研究者们对匹配偏差的关注(Evans,1972,1998;Evans & Lynch,1973),他们可能认为该任务中的被试没有发生更高级的类型2加工。然而,埃万斯(Evans,2006)提出的证据表明,在任务过程中被试采用了类型2加工,甚至那些错选A和8的被试也采用了类型2加工。首先,埃万斯(Evans,2006)在讨论他开创的卡片检查范式(Lucas & Ball,2005;Roberts & Newton,2001)时指出,虽然被试会不成比例地看那些将要选择的卡片(正是这一发现导致研究者推论被试采用自主的类型1加工决定自己的选择),但从花在这些卡片上的时间长度可以推测,他们仍启用了分析性的类型2思维(即便只为自动触发的选择提供理由,仍需启动类型2加工)。其次,通过出声思考的研究发现,被试可以用分析性思维来验证他们的反应(他们报告的各种想法都是有理由的;Evans & Wason,1976),即他们曾经考虑到了卡片背面的各种可能性。我们认为埃万斯(Evans,2006)的论述是正确的,即类型2认知参与了卡片任务,但并没有对可能的现实世界进行全面的认知模拟。这只是类型2加工的肤浅模式。通过对出声思考的分析,似乎大多数被试都在进行缓慢的、串行的认知加工,但并不全面。具有代表性的思维过程通常是这样的:“好吧,让我想想,我会翻开卡片A的背面看看是否是偶数。然后,我会翻开卡片8以确定其背面是否是元音。”然后被试会停下来。这种情形明显地证明了如下事实。首先,被试正在进行某种类型2加工。大多数类型1加工无助于解决这个问题。其次,由于情感加工没有参与,所以情绪调节过程也不能帮助解决这个问题。除非被试经过逻辑思维训练,否则他不会具有高超的、自动化的逻辑思维模式。最后,由于这个问题在进化过程中并没有涉及,所以各种达尔文模块也无法派上用场。上述例子中,被试虽然采用了类型2加工,却是非常不全面的。被试只是采用了串行联想认知,而未能对备择世界进行全面模拟(备择世界包括规则是错误的情形)。被试没有构建出规则错误的情况(背面是奇数的元音卡片)。被试没有系统地考虑卡片有可能是元音/奇数组合。相反,被试只是以规则为真为出发点思考了各种可能性。正确答案是:K(否)、A(是)、8(否)、5(是),即翻看卡片A和卡片5才是正确答案。对各种可能性的心理模拟应包括规则为假的情形,遗憾的是多数被试并未做到这点。被试选择卡片的情况说明人们在构建各种情境时,往往很难超越实验者给定的情形以及假定规则为真的定势。因此,在这一任务中采用的类型2加工并不是完全的备择世界模拟。它只是一种肤浅的思维类型,这种思维的灵活性受制于给定的思考起点。串行联想认知不同于自主心智的快速、平行的加工模式,由于从给定的思考起点展开联想是最容易构建的,因此串行联想认知往往由此展开。在卡片推理任务中,被试聚焦于一点展开推理,即从焦点出发展开系列联想,而根本没有构建其他可能的情形。在我们的认知模型中,将其命名为“具有焦点偏差的串行联想认知”(serial associative cognition with a focal bias)。2.7  吝啬的串行联想认知过程将焦点偏差(focal bias)的概念情景化的一种方式是将其置于思考人类信息处理过程框架的第二阶段,我们也将在本书中反复讨论这个阶段,并在第三章中展开讨论人类是认知吝啬鬼的概念。由于人们的基本倾向是默认低消耗的计算处理机制,因此人们成了认知吝啬鬼。霍尔(Hull,2001)幽默地说:“人类似乎遵循这样的规则,只有当其他一切都失败时,才让大脑参与进来,甚至通常也不参与进来。”更严重的是,里歇森和博伊德(Richerson & Boyd,2005)在进化的起源问题上提出了同样的观点:“实际上,所有的动物在严峻的选择压力下,都难以避免愚蠢的选择。”事实上,认知上的吝啬体现在两个方面。双过程理论迄今只强调了认知吝啬鬼的规则1:尽可能地默认类型1加工。但是默认的类型1加工并不总是管用,特别是在新异情境下。这些新异情境既没能唤起特定进化模块所需的刺激,也没有任何信息来唤起自主心智中那些通过过度学习获得的封装模块。在这种情况下,类型2加工过程就显得尤为必要。但此时认知吝啬鬼的默认模式仍然存在,这就是认知吝啬鬼的规则2:当类型2加工必要时,默认的加工模式是具有焦点偏差的串行联想认知(不是完全的去耦模拟)。焦点偏差的概念概括了文献中几个密切相关的观点,包括:奇异性原则(singularity principle;Evans,Over,& Handley,2003);真相原则(principle of truth;Johnson-Laird,1999,2005,2006);“所见即所有”倾向(what you see is all there is,WYSIATI;Kahneman,2011);聚焦(focusing;Legrenzi,Girotto,& Johnson-Laird,1993);效果/付出(effect/effort)问题(Sperber,Cara,& Girotto,1995);元认知性短视(metacognitive myopia;Fiedler,2012)。最后还有社会心理学领域著名的聚焦(focalism)概念(Wilson,Wheatley,Meyers,Gilbert,& Axsom,2000)和信念接受(belief acceptance)问题(Gilbert,1991)。将上述所有这些倾向结合在一起便形成了焦点偏差概念,其基本思想是人类的信息处理器强烈倾向于只处理最容易构建的认知模型。因此,最容易构建的聚焦模型(串行联想认知处理的唯一模型)常会主导认知过程。聚焦模型的特点有:往往只倾向于表征事件的某一种状态,如奇异性(Evans et al.,2003);所见即是真(e.g.,Gilbert,1991;Johnson-Laird,1999);最小化努力(Sperber et al.,1995);忽略调节因素(见社会心理学文献,e.g.,Wilson et al.,2000)。考虑调节因素需要对几种不同的可能情况进行建模,聚焦加工恰好可以使我们避免这样做。根据认知科学中大量关于信念偏差的研究,以及民间随处可见的自我中心归因偏见,可以得出这样的结论:个体最容易使用的模型显然是那些最接近于个体已经相信并已经构建好的模型(e.g.,Evans,2002,2014;Stanovich,West,& Toplak,2013)。因此,串行联想认知的定义为:依赖于单一焦点触发所有后续思维的认知加工模型。例如,框架效应(framing effect)就是典型的具有焦点偏差的串行联想认知模式。正如卡尼曼(Kahneman,2003)所指出的,“框架的基本特征是被动接受给定的表征”。呈现给被试的框架被视为焦点,所有后续的想法都来自于它,而不是替代的框架,因为后者需要耗费更多的计算成本来实现心理模拟。在介绍了串行联想认知的概念之后,我们现在可以返回到图2-3,并提出反思心智的第三种功能:发起中断串行联想认知(箭头F)。这个中断信号改变了串行联想序列中的下一个步骤,否则思维会沿原序列继续进行下去。这个中断信号也可能完全停止串行联想认知,从而启动一个全面的模拟(箭头C)。或者,它可以通过改变当前串行联想加工的临时焦点模型,从另一个起点启动一个新的串行联想加工(箭头E)。2.8  知识结构(心智资源)的重要性双过程理论相对忽略的一个方面是,成功的类型2压制操作需要程序性和陈述性知识。虽然压制类型1反应本身可能是程序性的,但是生成替代反应的过程通常要使用各种类型的储备知识。在心理模拟过程中,需要使用陈述性知识和策略规则(语言编码策略)来实现去耦表征转换。可以被提取和用来转换去耦表征的知识、规则、程序和策略,被称为“心智资源”(mindware),这个术语是由戴维·珀金斯(David Perkins)在其1995年的书中首先使用的(Clark,2001;克拉克使用这个术语的方式与珀金斯创造这个词的初衷略有不同)。在认知模拟过程中可用的心智资源部分来源于过去的学习经验。这意味着个体在心理模拟中以更优选项来替代类型1反应的能力差异取决于其可用心智资源的差异。事实上,三重心智模型中的每一个层级都需要知识才能运行。一个人的反思心智不仅应触及常识结构,更重要的是,还应触及他的观点、信念和深思熟虑的目标结构(通常称为偏好;Gauthier,1986)。一个人的算法心智则包括认知操作的微策略以及一系列行为和思想的加工规则。最后,一个人的自主心智不仅包括由进化形成的封装知识库,还包括由于过度学习和实践而被编译封装,并可自动激活的知识。当然,每个人的知识库都是独一无二的。此外,算法层级和反思层级的进程还接收来自自主思维运算的结果(见图2-3,图中的箭头G表示前注意过程的影响)。由于晶体–流体智力理论(CHC)是最全面有效的智能理论之一,因此了解它的两个主要组成部分如何忽略了理性思维这个关键方面是很重要的。当然,流体智力与理性有一定的关系,因为它是体现算法心智维持去耦能力强弱的指标。由于去耦和模拟对于理性思维的重要意义,在某些情况下流体智力一定会促进理性。然而,发起压制(图2-3中的箭头B)和发起心理模拟(图2-3中的箭头D)的倾向都是智力测验未涉及的反思心智,通常的智力测验漏掉了这些理性成分。这类心理特征主要被典型行为测验(认知风格和思维倾向)所测量,而智力测验等最佳行为测验通常不涉及这些内容。晶体智力与流体智力的情况略有不同。理性思维在很大程度上依靠获取到的特定知识。理论上讲,这些知识属于晶体智力。但是,这些晶体知识被实际的智力测验评估了吗?答案是:没有。支撑理性思维的知识具有特殊性,涉及概率推理、因果推理和科学推理等领域,我们会在后续章节中讲解CART各成分时逐一介绍。相反,在智力测验中评估的晶体知识只具有普遍性而没有特殊性。这主要是因为测验的设计者为了保证言语和知识抽样的公平性和无偏化,会特意拓宽对词汇、言语理解和一般知识的抽样。简而言之,传统的晶体智力测量不评估个体在理性方面的差异。2.9  理性的行为倾向和知识基础基于全部心智过程讨论到目前为止,读者可能误以为似乎只有算法心智和反思心智涉及理性思维。这种理解是错误的。事实上,自主心智、算法心智和反思心智,都为理性思维做出了贡献。我们要强调的是,自主心智为理性思维做贡献的方式比较特别。在上一节中提到的一点是,自主心智包含了由于过度学习和实践而被封装的理性规则和规范策略,这些规则和规范策略可被自动激活。这意味着,对一些人来说,在某些情况下的规范反应直接来自于自主心智,而不是成本更高的类型2心理模拟过程。图2-4更清楚地说明了我们想强调的观点。通过删除所有表示串行联想认知和反应的标注,我们得到了这个简化图。图2-4的右上角显示的是在文献中讨论最多的可调用的心智资源类型。图中还可见,来自自主心智的非规范性反应被打断,更耗能的心理模拟过程正在进行。这种模拟过程包括耗能提取所需心智资源的过程。

图2-4 自动化心智资源和心理模拟过程中使用的心智资源的简化模型与规范性反应(normative responding)所涉及的心智资源相对比,图2-4左下部表示的是一种不同性质的规范反应所需的心智资源。图中显示了我们前面强调的一点,即在自主心智中也可以包含规范规则和理性策略,这些规则和策略已经被演练成自动化模式,并且能够自动地与存储在自主心智中的任何替代性的非规范反应竞争(通常是立即击败其他非规范反应)。因此,如图2-4所示,它并不来自于系统2的规范反应,即系统2不是理性反应的必然来源(在最近关于双过程理论的研究中有许多此类研究),快速反应也不一定都是不正确的。图2-4的主要目的是聚焦于这样一种思想,即理性的规范思维并非只来源于心理模拟活动,如果实践足够多,它可以直接自动地从自主心智中产生。正如我们将在第三章中看到的那样,这使得对双过程情境下启发与偏差任务表现的解释变得更加复杂。2.10  我们的认知结构模型、理性及后续章节我们所描述的认知结构虽然不完整,但其精细程度已足以作为CART的总体框架。斯坦诺维奇(Stanovich,2011)探讨了比这里呈现的更丰富的实证证据,特别是关于算法心智与反思心智分离性的证据。目前我们采用的模型为后续章节中的启发与偏差任务的情境化和分类提供了足够的理论框架。从第三章开始我们会对这些任务的分类进行介绍。如模型所示,这些分类源于理性需要的三个心智元素。第一,反思心智的特点必须是主动压制自主心智产生的非最优反应,并启动心理模拟,从而产生更好的反应。第二,算法层级的认知能力(Gf)是压制和持续心理模拟所必需的。第三,在心理模拟过程中必须确保理性算法所需的心智资源是可以使用的,或者这些心智资源由于已高度熟练化,可以直接被自主心智所使用(参见图2-4)。智力测验主要评估了实现理性思维和行动的三种元素中的第二种。这就是评估理性不能仅依赖智力测验的原因。在第三章中,我们将解锁启发与偏差任务的逻辑,这些任务和逻辑非常复杂,但仍然有维度可循。我们将描述启发与偏差任务的各个维度,从而使我们能够对人们在这些任务上所犯的认知错误类型进行分类。在第四章中,我们会使用这个分类来建立评估理性思维的框架,并确定构成CART的全部任务类型。从第五章到第十一章,我们将依次讨论评估工具中的每一项理性思维任务。第三章 避免吝啬加工:检测、压制和心智资源启发与偏差任务是为研究人类的大脑而设计的,不适合研究动物的大脑。准确地讲,启发与偏差任务所研究的大脑,至少能够产生潜在的意识冲突。这也就是为什么卡尼曼曾强调,他和特沃斯基一致认为启发与偏差任务符合双过程理论(Kahneman,2000)。此外,埃万斯和斯坦诺维奇(Evans & Stanovich,2013)指出,所有包含双过程理论的多过程模型,都抓住了人类决策的重要特性,即人们常常对自己的选择感到疏离。通俗心理学和专家们所说的“意志力薄弱”也正好体现了这一点。举例来说,当我们意识到吸烟有害健康的时候,我们并没有停止这个坏习惯,而是一如既往地沉迷于吸烟。又比如说,许多人总喜欢在一顿饱餐后吃一份甜点,而一小时之前,他们可能还在信誓旦旦地制定着减肥大计。不仅如此,这种抉择中的疏离感也时常发生在无关意志力的反应中。比如当我们的前面突然出现一个毁容者时,绝大多数人的反应是下意识地回避和躲闪,但这种反应恰恰与他们自己所倡导的包容与和谐的价值观背道而驰。这种疏离感会令人精神不安,但实际上它反映了人类认知中独有的一个方面,即元表征(metareprentationl)能力。类型2过程中的元表征能力有利于我们对自己的信念和欲望进行认知批判。人类可以在优先保持当前反应的同时,在大脑中表征另一个理想化(如假设推理)的反应。另一种说法是,启发与偏差特性是高级进化层级物种波普尔(Popperian)生物和格雷戈里(Gregorian)生物的特性,而不是低级的达尔文生物和斯金纳生物的特性。这里,我们再次引用了丹内特简短但具有启发性的著作《心灵种种》中的分类(Denett,1996),书中将人类大脑的各种短牵制(short-leashed)策略和长牵制(long-leashed)策略描述为不同心智。这些心智都存在于人脑当中,并会同时运行来解决问题。这些心智反映了人类大脑日益增强的预测未来的机能。达尔文心智一般使用预先形成的反射,类似于“按最佳方式行动”;斯金纳式心智通常采用操作性条件反射的机制来塑造自身以应对一个新异情境。波普尔心智(以哲学家卡尔·波普尔(Karl Popper)的名字命名)能够在反应之前预测各种可能性并在头脑中进行检验,即运行双过程理论中具有元表征功能的系统2过程;格雷戈里心智(以心理学家理查德·格雷戈里(Richard Gregory)的名字命名)则利用各种心智资源来对各种可能的反应进行预先检验。正如第二章所述,个体的计算能力保证了波普尔心智中的串行模拟,这种计算能力即CHC模型中的流体智力;而串行模拟中所使用的文化工具(如知识),即在丹内特的模型中的格雷戈里心智,在CHC模型中则被称为晶体智力。我们说启发与偏差任务是为研究具有波普尔和格雷戈里心智的生物体(人类)而提出的,这并不意味着非人类生物的理性不能被评估。我们在第一章讨论的理性评估的公理化方法,可以使非人类生物体的理性思维和人类一样得以评估,因为这种方法遵循一致性和连续性原则,并且体现了工具性理性的概念(Kacelnik,2006;Luce & Raiffa,1957;Savage,1954)。事实上,许多动物似乎都有一定程度的工具性理性;研究发现,大多非人类生物体的行为相当符合理性选择公理(Alock,2005;Binmore,2009;Dukas,1998;Fantino & Stolarz-Frantino,2005;Hurley & Nudds,2006;Real,1991;Schuck-Paim & Kacelnik,2002;Schuck-Paim;Pompilio & Kacelnik,2004)。理论上讲,由于遗传基因水平上的适应最优化很可能与机体水平的适应最优化是分离的,因此非人类生物体的行为可以脱离理性决策的公理(Barkow,1989;Dawkins,1982;Houston,1997;Marcus,2008;Over,2002;Skyrms,1996;Stanovich,2004;Waksberg,Smith & Burd,2009)。尽管在动物世界中这种分离确实会发生(Bateson,Healy,& Hurly,2002,2003),但是实际情况正如研究者(Sata & Ferejohn,1994)指出的那样,“鸽子的行为相当理性,符合理性抉择的公理性”。尽管可以对非人类生物的理性进行评估,但当我们对具有超越低级思维,达到波普尔和格雷戈里心智的生物体(人类)的理性进行研究时,理性研究才是最有趣的。波普尔和格雷戈里心智也许可以生成比达尔文或斯金纳式心智更好的解决问题的方法,由此产生了双过程概念,并吸引了大量的研究者。评估哪种心智会更优的研究也成为评定理性程度的关键所在。而启发与偏差任务就是体现双过程加工的具体形式。采用双过程加工框架下的启发与偏差任务(Kahneman,2011),其目的是判断类型1和类型2过程在相互竞争中谁会胜出。我们采用这些方法和思想的目的是将理性思维的概念可操作化,从而使我们可以评估个体差异。这里有两个背景知识需要说明。第一个背景知识是,我们的理性模型的约束条件是我们只评估个体水平的理性,而不评估亚个体(subpersonal)水平的理性(Bermudez,2001;Frankish,2009)。我们不关心人类的记忆系统构造的合理性,只认为个体在记忆的效能和存储量上存在差别,即我们不关心大脑运行的子过程(subprocesses)本身是否理性。我们关注的理性是个体在其所处情境下实现具体目标的行为。当然,我们可以进一步将所处情境的外延拓展至大脑本身,探讨子模块(submodule)的策略选择是否合理。但这样做会产生两个问题。第一,我们探索亚个体水平的目的是什么以及获益是什么?实际上,目前对大脑子结构的研究还没有定论(Stanovich,2004)。第二,这样做会导致无限微观化,我们甚至要去探讨一个神经元的放电是理性的还是非理性的,而这种说法又和理性的定义矛盾了。正如欧克斯福德和查特(Oaksford & Chater,1998)指出的,“一个优化的模型不等于一个理性的模型,优化也不等于理性。比如,人体的胃无论是很好还是很差地适应其消化功能,由于其本身没有信仰、欲望和知识,因此,胃的理性便无从谈起。”我们要强调的第二个背景知识是:“类型1加工一定错,类型2加工一定对”的观点是错的(Evans & Stanovich,2013),因为在某些情况下也有可能引起类型1的规范化正确反应,以及类型2的非规范化错误反应。比如类型2过程采用了污化心智资源(contaminated mindware)时就是如此,这种情况我们在本章稍后详细谈论。但研究统计表明,大多数研究双过程的理论家都一致认为,类型1加工一般会引发非规范化的错误反应,而类型2加工一般会产生规范化的正确反应。埃万斯和斯坦诺维奇(Evans & Stanovich,2013)也曾指出,不管在实验中还是在现实生活中,大多数的任务还是提倡使用类型2来解决问题。我们还需进一步阐明,我们倾向于采用类型1和类型2这两个术语,而没使用其他也很流行的术语的原因。比如,艾普斯坦(Epstein,1994)使用的是“经验系统”(experiential system)和“理性系统”(rational system)这两个术语,这样的命名错误地暗示了类型2加工总是产生规范化的理性反应,而经验系统总是错的。再如,吉伯德(Gibbard,1990)将类型2过程命名为“规范化控制系统的输出”,这同样暗示了类型2过程总是规范化的。还有克莱因(Klein,1998)将类型2加工命名为“理性选择策略”(rational choice strategies)。正如我们前面所说,理性是机体水平的概念,不能用于亚个体水平。也就是说,类型2和类型1过程都是描述外显行为的理性程度的术语。3.1  启发与偏差的逻辑综上所述,如果人类只是具有系统1的有机体,我们就不需要用启发与偏差任务来评估我们的能力了。又或者可以说,如果我们是波普尔生物,但类型1过程总是引起正确反应,我们也不需要用启发与偏差任务进行评估了。1对于波普尔生物来说,类型1过程在恶性环境中常常会产生重大错误,因此我们需要用启发与偏差任务来评估理性。正如我们在第二章所讨论过的那样,人类默认经常使用类型1加工,但其所处的环境可能是友好的,也可能是敌对的。友好(或良性)环境是指环境里包含有用的线索,通过实践或者进化,类型1子系统已经很好地表征了这些线索。另外,一个环境被称为友好环境,还包括没有其他别有用心的人试图操控那些仅依赖类型1加工的个体的情形。但我们的观点是(Stanovich,2004;Stanovich & West,2000),现代生活环境对类型1加工来说有时是敌对的(或恶性的),比如当我们面对商业广告时。因此,通过启发与偏差任务来评估理性思维倾向就显得尤为重要了。我们还可以用另一个视角来阐明理性评估的重要意义,那就是智力测验并没有评估理性思维。虽然一些读者可能会认为,智力测验明显地评估了类型2的推理能力,即有意识地用心理模拟和想象去解决问题的能力,这一观点并没有错,但这些读者忽略了其中的一个关键差别。智力测验通常非常明显地要求被试必须用类型2加工来解决问题。很明显,如果一个人仅仅依靠快速的、自动的直觉过程来回答智力测验题目,那他一定不会有好的表现。但大多数理性评估测验不会用明显的线索来提示被试。相反,许多启发与偏差任务激活了被试容易出错的直觉反应。与智力测验不同,启发与偏差任务中的被试首先必须检测出类型1反应的错误,然后必须通过类型2过程去压制类型1反应,并进行心理模拟来找到一个更好的选择。基于我们的心智分类,让我们回顾一下第二章所谈到的3种理性思维的心理特征(Stanovich & West,2008b),看看它们是怎样在启发与偏差任务中起作用的。首先,人们必须要认识到压制类型1进程的必要性。也就是说,被试必须有能力检测到直觉反应和自己习得的规范化准则在解决问题时产生的冲突。其次,在心理模拟过程中,人们要有可调用的用于理性反应运算的心智资源。最后,人们要有较好的算法层级的认知能力,以保证压制和模拟运算能够持续下去。冲突检测(conflict detection)是理性思维需要的第一个心理特征,近年来相关研究在心理学文献中也慢慢增多(De Neys,2014;De Neys & Glumicic,2008;Stanovich & West,2008b;Thompson,2009;Thompson & Johnson,2014;Thompson & Morsanyi,2012)。第二个心理特征——预先习得的心智资源,其重要性在心理学文献中仍未被正确评价。同样,第三个心理特征——可持续的认知去耦,也时常被忽略。比如,在推断启发与偏差任务中所表现出来的认知能力和规范化反应的正相关关系的原因时,卡尼曼和弗雷德里克(Kahneman & Frederick,2002)指出,拥有较高认知能力的人“一般更可能掌握重要的逻辑准则并将这些准则用于特定情境”。拥有逻辑规则和能够使用逻辑规则需要满足两个条件:心智资源和冲突检测。只有具备这两个条件才能使类型2过程替代类型1反应。上面的说法其实还忽略了第三个条件。也就是说,即使意识到压制的必要性,并且具有良好的心智资源,理性思维过程还需要去解决冲突。解决冲突有利于建立规范化反应,而这需要较高的认知能力,尤其是在认知去耦发生的关键期。在第二章我们讲过,认知去耦包括抑制直觉反应和模拟备择反应。近期在有关抑制和执行功能的研究中研究者发现,认知去耦对能力要求非常高,并且它与流体智力中的个体差异紧密相关。这正是理性思维所需的第三个心理特征——持续认知去耦。这一特征的缺失通常被定义为“持续压制失败”(failure of sustained override)。3.2  心智资源、冲突检测和压制的相互关系我们必须意识到拥有心智资源、检测到压制需求的能力以及持续压制能力并不是认知需求的三个独立的分类。恰恰相反,它们在许多重要的过程中相互纠缠、互相依赖。这里我们将探讨更多的影响因素,这进一步增加了模型的复杂性。首先,如果缺乏相关的心智资源,被试一定会通过类型1加工启动一个反应。但如果缺乏规范的适宜反应,无论个体是否有能力持续压制,都没有什么意义。这种情况下,由于产生冲突感的心智资源缺乏,冲突检测能力也不重要了。其次,如果有相关的心智资源,那么被试就可以检测出冲突。但是,即使有相关的心智资源,如果被试没有找到压制直觉反应的理由,也不会采取持续性压制。简而言之,一个特定任务是否可以用于评估特定个体“向下”的持续压制能力,取决于这个个体“向上”的冲突检测能力和心智资源调用情况。压制失败和缺乏心智资源是一种此消彼长的关系。一个拥有良好的习得心智资源的个体出现了决策错误,更可能的原因是压制失败,而非心智资源缺乏。相反,压制失败也不太可能归咎于一个人缺乏或者拥有匮乏的习得心智资源。这两类错误在一个连续维度上此消彼长,两者间界限模糊。当然,在压制失败的案例中,个体并没有使用良好的习得性规则。当规则越来越不能被实例化(instantiation),以至于在某一点上它被编译得如此差,从而难以在压制过程中被调用时,心智资源缺乏就导致了压制失败,也就是说,加工问题演变成了知识问题。下文的两幅图显示了心智资源、冲突检测和持续压制能力三者间相互关联的复杂关系。图3-1列出了心智资源实例化的不同水平。2图中最左边区域反映的是缺乏心智资源的情形。当相关的心智资源被反复练习,并储存于长时记忆系统后,类型2加工才能将其提取出来。图的正中间区域代表有习得的心智资源,但还未达到自动化调用水平的情形,必须通过高消耗的类型2加工才能调用心智资源,以帮助实现运算反应,并与系统1自动发出的直觉反应相竞争。图的最右边区域代表心智资源达到了自动化调用的水平。相关心智资源由于过度练习而进入了系统1,如同系统1本身一样,可以自动、自主地被激活。这种过度练习,使心智资源不需要类型2的压制功能,就可自动战胜系统1中的直觉反应。简而言之,图3-1中的右边区域不需要持续性压制,越是近期习得的心智资源越是可以“碾压”类型1的直觉反应,而成为当前的主导反应。落在这个区域的被试,即当其规范化心智资源能被很好地实例化时,几乎总能做出正确决策。所以,图中的左右两部分形成了鲜明的对比。当心智资源被练习得很少时,被试无法检测到冲突,会因心智缺陷而犯错。由于心智资源没有得到充分的实例化,反思心智也不能检测出压制的必要性,无法发起对类型1反应的压制。

图3-1 心智资源连续体上的不同加工状态图3-1的中间部分表示的是系统1启动的直觉反应和系统2模拟规范化反应对其压制时产生的冲突。被试的反应正确与否主要取决于持续压制是否成功。这个系统1和系统2的冲突区由心智资源实例化连续水平线上的A和B两条临界线围成。虚线A的左边表示,心智资源由于没有充分实例化,因而不能在规范化模拟中从长时记忆中被提取出来。虚线A和虚线B之间的区域代表的是,心智资源已充分实例化但还没有达到完全自动化以进入系统1的水平。虚线B的右边在前面已经讨论过了,是自动的规范化反应战胜直觉反应的区域。这里需要强调的是,图3-1表明,冲突检测的容易度和心智资源实例化程度虽然本质不同,但两者有很大的关联性。这点构成了我们本章后面主要讨论的主题——在很多偏差和启发任务中的冲突,很难区分到底是知识问题导致的还是加工问题导致的。图3-2更精细地展示了启发与偏差的理论逻辑。心智资源连续水平线上的字母W到Z有助于区分5种不同加工状态。W代表冲突可能发生的临界点,它的左边区域表示还没有形成相关心智资源,因此也不产生冲突;W的右侧表示直觉反应和习得的规范化准则之间的冲突是可能发生的;事实上,只有部分被试能在特定任务中检测到冲突(参见本章注释2),这些被试已经到达了X水平。处在W和X水平之间的被试,已具有可以提取的心智资源,他们能够产生运算反应,但因为没能检测到冲突,因此未能启动持续压制。这种加工状态称为“检测错误”。处在X右侧区域的被试可以检测到冲突,也可以进行压制。Y水平划分了持续压制成功和失败两种情形。X和Y之间的区域所代表的状态正是德奈伊斯通过大量研究所考察的内容(De Neys,2006a,2006b,2014;De Neys & Franssens,2009;De Neys & Glumicic,2008;De Neys,Moyens & Vansteenwegen,2010;Thompson & Johnson,2014)。他的研究小组通过启发与偏差任务范式证实,各种内隐测量指标(如决策潜伏期、突发性回忆、大脑激活以及自发性觉醒)可以表明,被试有时确实检测到了冲突,虽然他们最终未能成功压制类型1加工过程。相反,Y和Z之间的区域代表压制成功的状态。充分实例化的心智资源可以促使被试更容易地进行冲突检测并获得成功,同样也可以在模拟过程中持续提取心智资源,从而大大提高压制成功的可能性。

图3-2 心智资源连续体上的加工状态最后,我们再将视线聚焦在Z右侧区域。这块区域我们之前已讨论过,并在图3-1中有所阐述。在这个区域的被试没有必要对直觉反应进行压制,因为规范化的心智资源已经充分实例化而进入到系统1之中,成为当时的主导反应。现在,我们对图3-2进行一个总结:W左侧表示由于缺乏心智资源而导致错误的情形;W和X之间的区域表示冲突检测失败导致错误的情形;X和Y之间的区域表示压制失败导致错误的情形;Y和Z之间的区域表示由于持续压制而产生正确反应的情形;Z右侧表示系统1自动产生规范化响应做出正确反应的情形。图3-2中,从左向右表示反应正确的可能性逐渐增加,心智资源调用越来越自动化,冲突检测、压制越来越容易。图3-2最重要的意义在于它阐明了在心智资源实例化程度的连续变化中认知加工(失败或成功)的不同状态。3.3  思维错误的分类接下来在我们之前讨论的基础上,我们将要探讨思维错误的分类。让我们从表3-1开始。表3-1 推理错误类型

基于前面的论述,我们已经可以将知识问题与加工问题区分开来。先前我们讨论过的联动机制是:缺乏优质的实例化心智资源往往导致压制困难,以及默认采取类型1加工。我们通常称加工问题为“吝啬加工”,称知识问题(或内容问题)为“心智资源问题”。在过去40年的心理和认知科学研究中,学者们一直围绕着“人类是认知吝啬鬼”这一主题展开讨论(Dawes,1976;Kahneman,2011;Simon,1955,1956;Taylor,1981;Tversky & Kahneman,1974;关于其中的进化机制,见Stanovich,2004,2009)。当碰到问题时,我们的大脑会运用各种运算机制来加以处理。这些机制在功效与能耗间寻求平衡(Tomlin et al.,2015)。虽然有些机制拥有强大的计算能力,可以解决大量的新异问题,但是同时,这些机制需要占用大量的注意力资源,速度慢,同时还干扰其他思维和行为。由于需要集中精力,因此这个过程常常是令人厌恶的(Kahneman,1973;Kurzban,Duckworth,Kable & Myers,2013;Navon,1989;Westbrook & Braver,2015)。人类之所以被称为“认知吝啬鬼”,是因为我们总是趋向于默认一种低耗能的处理方式,比如类型1加工。虽然人们倾向于类型1加工,但并非总是如此。有时会有两种类型2加工(如心理模拟或串行联想认知)可供采用,而“认知吝啬鬼”会再次选择较低耗能的加工——串行联想认知。3如表3-1所示,吝啬加工有三种类型,其中的两种我们前面已经讨论过了。最低级的思维错误类型是趋向于默认调用自主心智(default to autonomous mind)的反应,没有类型2进程的参与。如果心智资源中储存有规范化反应,但大脑没有意识到压制的必要性,也会产生这种类型的思维错误。在双加工理论研究文献中,这种加工错误有时被称为“压制失败”。也就是说,以前的一些学者不同意我们在图3-2中提出的分类方法(以X为界限区分的两块区域)。但我们认为,这种错误如果是由压制失败导致的,类型2加工和类型1加工之间就必须存在竞争冲突,只有类型2加工竞争失败才算真正的压制失败,如果根本没调用类型2加工,那么就不应该被认为是压制失败。相比双过程理论后期的研究者,启发与偏差的早期研究者其实对这点有更深刻的认识。早期的启发与偏差研究常采用印象和判断差异的研究范式(Kahneman,2003;Kahneman & Frederick,2002,2005)。这些研究清楚地表明,导致非规范化反应的原因通常不是来自于类型1和类型2的冲突,而是来自直觉印象,而这些直觉印象错误地与类型2加工中所采用的规则和策略相脱节。卡尼曼(Kahneman,2011)也在其代表性著作中梳理了几十年来的启发与偏差研究,并澄清了这点。之前的一些学者还采用了现象学分类的方法,但他们混淆了被试默认调用系统1加工和对系统1加工压制失败之间的区别。在这两种情况下,被试都会犯相同的错误,因此学者们常将两种原因混为一谈。但我们更倾向于对两者进行区分,并在我们的分类系统中将二者进行了分别描述。表3-1的左边第二栏,显示的是持续压制失败,它代表一个比默认调用自主心智的吝啬趋势稍微弱一些的类型。类型2加工试图让类型1的自主心智离线,直到通过假设推理形成更优的反应,但最终失败了。在这种压制失败的情况中,认知去耦确实发生了,只是这个加工过程没有压制住自主心智的类型1加工。持续压制失败还包含了民间心理学所说的意志力问题(Ainslie,2001,2005;现代认知科学领域和大众心目中的意志力概念有细微的差别)。心理学家和经济学家通常认为意志力反映了自我控制上的问题(Baumeister & Vohs,2003,2007;Hofmann,Friese,& Strack,2009;Loewenstein,Read,& Baumeister,2003)。但是,这种分类并不仅仅反映了意志力和自我控制问题。斯洛曼(Sloman,1996)指出,至少对部分被试来说,琳达合取问题(Linda conjunction problem)才是双加工中最本质的冲突(详见第五章;Tversky & Kahneman,1983)。为了阐述这一点,斯洛曼引用了斯蒂芬·古尔德的出声报告(Gould,1991):“我知道(合取)不太可能,但我头脑中的小人上蹿下跳,冲我大吼,'她不可能只是一名银行柜员,好好读读描述就能知道’。”像古尔德这样思维复杂的被试解决琳达问题的过程明显体现出了类型1和类型2之间的冲突。他在这个任务上所犯的合取谬误(conjunction errors),就是压制失败的典型例证。然而,这项任务中的大多数被试并没有内省,他们的类型2加工要么没有参与工作,要么就是只参与了一点点,而不足以引起认知冲突。对于这些被试来说,他们产生合取谬误的原因只是默认采用了自主心智。表3-1所展示的第三种吝啬加工过程类型是具有焦点偏差的串行联想认知。这一特点代表着个体在类型2过程中具有过度简化的趋势,即未能对备择世界进行全面的心理模拟或者未能开展完整的析取推理(disjunctive reasoning)(Shafir,1994;Toplak & Stanovich,2002)。我们在第二章讨论的四卡片选择任务就是其中的一个例证。这种错误类型表明,不是所有的吝啬加工都与冲突检测缺陷有关。表3-1中第四种错误是心智资源缺乏,如图3-1和图3-2最左侧所示。被试根据系统1生成直觉反应,从而导致在完成任务时出现错误。这里不涉及冲突检测问题或持续压制失败问题,因为被试还不具有足够的心智资源,以使其意识到冲突。由于缺少许多心理模拟所需的相关知识,如概率推理、因果推理、逻辑思维和科学思维等方面的知识,这类被试常常表现出缺乏理性思维的行为。这类缺乏心智资源的个体在现实生活中也常会遇到问题。比如,病态赌博行为的研究已经揭示,这类患者往往缺乏概率和概率事件的知识(Keren,1994;Rogers,1998;Toneatto,1999;Toplak et al.,2007;Wagenaar,1988)。同样地,当在个人财务领域缺乏相关的心智资源时,个体就会在个人财务管理和计划方面出问题(Lusardi & Mitchell,2014)。表3-1中最后一种错误是污化心智资源。到目前为止,我们只讨论了由于缺乏有用的心智资源而不能形成规范化反应的情形。“污化心智资源”一词表明,一些我们需要的心智资源本身就是阻碍我们达成目标的直接原因。这就是为什么埃万斯和斯坦诺维奇(Evans & Stanovich,2013)一直强调,研究者不能总是将类型2进程等同于理性,因为类型2进程有时会提取出一个不太理性的备择选项。简单地说,这是指一个被试可能拥有一大堆导致其缺乏理性的错误知识。比如在启发与偏差研究中的赌徒谬误(gambler's fallacy)和其他对概率的错误理解就是例证(Nickerson,2004;Roney & Trick,2009;Xu & Harvey,2014)。当然,心智资源缺乏和污化心智资源两者的界限在很多案例中并不清晰,尤其是在概率推理中。3.4  三类吝啬加工过程的例证下面,我们通过例子来解释每种类型的吝啬加工。弗雷德里克(Frederick,2005)的认知反思测验(cognitive reflection test,CRT)是测量由于未能检测到冲突而默认采用自主心智倾向的典型任务,而该测验的最典型题目就是球和球拍的问题:球和球拍的总价是1.1美元,已知球拍比球贵1美元,请问球的价格是多少?在回答这个问题时,许多人脑海中的第一反应是10美分,然后便不再进一步思考这个答案是否正确。试想,如果球的价格是10美分,那么球拍的价格就是1.1美元,球和球拍的总价将变为1.2美元,这和题目中给出的总价1.1美元是矛盾的。人们常常没有足够深入地进行思考,从而意识到错误,导致最终给出错误的答案。很明显,这些被试没有将5美分作为备择选项,因为他们觉得这种题目太简单了,可以不假思索地给出正确答案。做错这道题的被试没有对错误反应进行压制,其实只要产生了认知冲突,他们就很可能得到正确答案,但遗憾的是他们一开始就没有察觉到冲突。4三段论推理中的信念偏差(belief bias in syllogistic reasoning,后文统称“三段论信念偏差”)测验与“球和球拍”问题有显著的不同。这类问题主要考察,当逻辑与结论的可信度产生冲突时,二者谁会胜出并决定最终的反应。如果被试回答错误,通常意味着持续压制的失败。我们不妨以著名的“玫瑰”三段论来举例说明(Markovits & Nantel,1989;Stanovich & West,1998c)。前提1:所有的花都有花瓣;前提2:所有玫瑰都有花瓣;结论:因此,所有的玫瑰都是花。其实,这个推论是错误的。被试必须压制赞同所谓的“正确结论”的倾向,因为这个结论确实符合自然界的实情,即玫瑰都是花。当推理过程产生了一定的冲突时,被试需要暂停反应,因为这种冲突表明结论一定没有遵循逻辑,因此三段论的推论是错的。推理过程可能耗时几秒钟,甚至有些令人反感。因为在这段时间里思维是冲突的,被试必须压制承认“所有的玫瑰都是花”的自然倾向。这里所描述的过程中的斗争是压制失败的经典例证。尽管任务的指导语常常已经提示被试,推论过程可能存在潜在的冲突(即推论的逻辑性和结论的真实性之间的冲突),但很多被试仍然会犯错。5最后我们要讨论的是框架效应,它是具有焦点偏差的串行联想认知的典型例子。在特沃斯基和卡尼曼(Tversky & Kahneman,1981)提出的“亚洲疾病”问题中,两个等价的问题由于采用了不同措辞,从而使人们做出了不同的反应。这个问题及其他类似问题我们将在第八章进行详细论述。当研究者将问题的两个版本一起呈现时,大多数人都承认两个版本本质上是一个问题,只是表述不同罢了。关于框架效应的发生机制,卡尼曼认为“框架的基本原理是对给定表达方式的被动接受”(Kahneman,2003)。呈现给被试的框架相当于一个焦点,被试所有之后的思考都是基于这个焦点展开的,而不是其他焦点,因为后者需要花费更多的心力。再比如,现在的大多数人都喜欢买标有“94%脱脂”的牛排,而不愿意买同样一块,但标有“含脂6%”的牛排。当单独呈现“94%脱脂”时,被试不会产生类型1和类型2进程的斗争。被试没有通过模拟将一个情境转化成另一种情境去思考,即将“94%脱脂”转换为“含脂6%”,然后问自己“是否二者给自己的印象一样”。处理这类框架问题一般需要被试产生冲突反应,而不是直接给其冲突信息。后者如卡尼曼和特沃斯基(Kahneman & Tversky,1973)编制的著名的工程师/律师问题。除了框架效应,锚定效应(anchoring effect)给我们提供了另一个具有焦点偏差的串行联想认知的例证。我们也会在第八章进行详细讨论,在这里我们只谈锚定和调整启发式中反映的对不适宜的焦点偏差的操作。在这种效应中,被试过于关注“给定”的信息。或者正如卡尼曼(Kahneman,2011)在他的书中所言,他们是WYSIATI倾向——“所见即是所有”倾向的受害者。这个倾向表明,人们对通过系统1自动加工的信息的质量极不敏感;或者如卡尼曼所言:“当下的环境对我们的思维和行为的影响比我们已知的和想知的程度更大。”3.5  理性思维任务中知识和加工过程的相互关系结合表3-1,我们在这里需要强调的是,任何一个任务都不可能只和一种错误类型有关。我们尝试用特定的任务将各种错误类型区分开来。比如,运用三段论信念偏差(belief bias)来反映持续压制的失败,又或者用认知反思测验去反映默认的自主心智。简而言之,我们说一个任务可以部分反映吝啬加工问题,并不意味着它不能反映心智资源问题(这也是本章的重要观点之一)。因为,知识/心智资源问题和加工问题在启发与偏差任务中总是交织在一起。两者都是人们在逻辑思维中必不可少的一部分。下面我们将通过图表来解释这一观点。前文中的图3-1和图3-2分别展示了心智资源实例化和压制系统1困难度之间的依赖关系,以及心智资源实例化和冲突检测困难度之间的相互影响。比如,当规范化反应相关的心智资源更加实例化时,持续性压制就会更加容易实现;当心智资源充分实例化时,心智资源的调用就会完全自动化,此时就不需要压制系统1的反应了。图3-3用另一种方式呈现了启发与偏差任务中知识和加工之间的相互关系。这个图改编自斯坦诺维奇和韦斯特(Stanovich & West,2008b)在2008年的一个会议报告。图中构建了通向错误直觉反应的路径和通向规范化替代反应的路径。该图表明,检测和压制以知识为基础,此外,压制还依赖于检测。现在对该图从上到下加以说明。图的顶端是第一步,该阶段表示,对于特定的任务,被试是否具有相关的心智资源用于压制,即被试是否具有相关的陈述性知识以生成备择选项,从而替代直觉反应。如果缺乏相关的心智资源,被试一定会根据直觉进行反应。如果被试具有相关的心智资源,那么下一步的问题就变为:被试是否意识到压制直觉反应的必要性。如果被试没有找到压制的理由,即使具有相关的心智资源,被试也会跑偏,从而进入直觉反应路径2,如图3-3所示。下一个选择点涉及被试位于特定任务相关的心智资源连续水平上的哪个具体位置。如果相关的心智资源存在,并且这个被试已经注意到直觉反应的一个替代选择,那么问题就变为:这个任务是否需要持续抑制,即认知去耦,从而使被试能够压制直觉反应。如果心智资源能够自动化并且战胜直觉反应,那么不需要压制,系统1就会生成规范化反应(见图3-1和图3-2)。

图3-3 知识和加工在启发与偏差任务中的相互关系相反,如果规范化心智资源在系统1中没有实例化,同时如果这个任务需要持续性去耦以实现压制,那么我们就必须搞清楚被试是否有足够的认知能力去解决问题。如果有,被试会通过类型2的去耦和模拟生成规范化反应;如果没有,尽管具有相关的心智资源,以及意识到要使用它们,但被试还是会进入直觉反应路径3。总之,图3-3描述了心智资源、检测和压制之间的相互依赖关系,也清楚地说明了在缺乏心智资源时讨论检测和压制问题是无意义的。被试应具有最低的心智资源水平才能使检测错误或正确反应成为可能。心智资源的水平直接决定了检测到冲突的可能性,也间接决定了实现持续压制的可能性(或压制失败的可能性)。3.6  加工需求和知识需求的连续体一般来说,启发与偏差任务中知识和加工是交织在一起的,这只是理解这些任务逻辑的第一步。对于每项任务来说,对知识的依赖程度和对加工的依赖程度各不相同。一些启发与偏差任务可能更多地依靠加工过程而不是知识;另一些任务则可能更多地依靠知识而非加工过程;也有可能还有一些任务既有知识需求,又有加工需求。图3-4显示的是加工需求和知识需求的二维空间坐标系,不同启发与偏差任务被安置在这个坐标系中。横轴表示任务对知识的依赖程度,从最左边的低知识需求到最右边的高知识需求;而纵轴表示成功完成任务对冲突检测和持续压制(即加工过程)的依赖程度。高度依赖冲突检测和压制(即成功完成任务的关键是冲突检测和压制)的任务在纵轴的顶端,不依赖于冲突检测和压制的任务在纵轴的底端。

图3-4 启发与偏差任务中,加工需求与知识需求空间示意图在图3-4所示的二维空间里,有三个矩形用来表示不同类型的错误,错误类型依据加工/知识需求程度分属于这三个区域。左上方的区域代表成功完成任务必须高度依赖于冲突检测和压制过程,但不太依赖于特定心智资源(知识)的调用。如果在这类任务上出错,很有可能是加工方面的错误,而非心智资源方面的错误。但需要强调的是,没有哪个理性思维任务只涉及加工而不涉及心智资源。每一个理性思维任务都包含加工因素和知识因素,压制/检测倾向的水平和对心智资源的依赖性决定了任务在图中的位置。图3-4的右侧底部区域放置的是对专业知识需求度高的任务。这些任务对冲突检测和压制要求不高,因为被试通常不需要去克服一个来自系统1的冲突反应。这些任务中所表现出的错误大多可归咎于心智资源的缺失。右上方的矩形框表示不确定错误类型的任务。换句话说,这些任务对知识有较高的需求,但是它们也需要冲突检测和艰难地持续压制(不包括那些具有已经完全自主化的相关知识的情形)。由于这些不确定型错误的任务对知识和加工的需求度都很高,因此,我们无法通过观察到的错误反应来判断错误原因到底是哪个。图3-4的左下方是空白的,因为我们还没有找到一个对知识和冲突/压制需求都较低的任务来放置在这个区域中。然而,一些辅助测量方法(如思维倾向)可以放置在这个区域里,我们将在后面对此进行探讨。..

(0)

相关推荐

  • 超越智商part2

    每天一本书day313 超越智商part2 果然不出所料今天的阅读打起了瞌睡,这一部分是在是无聊,都是在讨论智力的评判标准,大部分都是在说传统智力监测的片面.但是真正大众认知的智力是无法量化的,而很多 ...

  • 《轻松学名方 (十四通窍活血汤》9

    你看为什么以前有这么神效,以前人呢,猎户手中经常会有麝香,一出现了,王清任就叫他送他自己药房,全部是最好. 所以呢,一个医神加上药很神的时候,这个病了真的治起来出神入化. 干血劳,一碰到了,都害怕的要 ...

  • 《轻松学名方 (十四通窍活血汤》8

    而且呢,白天还要煎黄芪八钱,慢慢服,能把气补回来,如此呢,一日之间同时吃三服药呀,三日就见效,十日见大效.一个月呢痊愈. 纵然牙齿脱落到烂腮帮了,都可以救活过来,这完全是在京城里头,治了很多以后,很有 ...

  • 《轻松学名方 (十四通窍活血汤》7

    好,接下来呢,太厉害了,简直就是病人的恶魔,白癜风.白癜风了,你以为实在是太难治,白癜风初期的时候呢?是血瘀在皮肤里,皮里. 服此药三十付可愈,白癜风孔窍里头的.皮肤的顽疾.瘀斑的我告诉你们,世界上所 ...

  • 《轻松学名方 (十四通窍活血汤》6

    这个控制能力是他心窍很灵的时候,就像小龙女的,她为什么那么厉害,是左右互搏,你单手用刀,那没有用,她左右可以分心来用,很聪明的人才做得到. 所以一般耳朵那叫他左边动,你自己去照镜子,你老是用头皮去扯的 ...

  • 《轻松学名方 (十四通窍活血汤》5

    好,我们回过来看头发呢?发窍毛窍眼睛是眼窍,那鼻子呢,鼻子是鼻窍. 酒糟鼻,人家以为太难治了,在京城那地方行医,你知道有多少酒糟鼻,因为那是歌舞升平的地方,酒馆客栈的大把,失意之人呢,在那里酗酒. 酗 ...

  • 《轻松学名方 (十四通窍活血汤》4

    医了一周两万块,哎呀,一年白干了,世间上什么事情呢最贵? 不小心的代价是最贵的.黄金虽贵,它必定有价,麝香再贵,花钱能买得到,那是你的不小心了,你可能是有的时候一辈子有多赚的钱你都搞不过来. 所有人过 ...

  • 《轻松学名方 (十四通窍活血汤》3

    所以它是现在是以0.1克一克来卖的,而且一丁点的将那些抠鼻屎那么一丁点的价值连城,现在是为什么是野生动物,老师不轻易用,也不轻易讲,不是没钱,你用一点的野生动物就死掉一点. 现在有人工驯养的,也有人工 ...

  • 《轻松学名方 (十四通窍活血汤》2

    今天因为是五逐淤汤排第一的,我昨天我还不舍得把第一的讲给你们听.排第一的叫什么汤?专门逐大脑瘀血的--通窍活血汤.而且呢,它能让你孔窍变得聪明的,因为它里面有一味药,我一直都不想讲,因为这个药呢,已经 ...

  • 《轻松学名方 (十四通窍活血汤》1

    2018.05.21 晴天 星期一 湖心亭公园 准备好没有? 准备好了. 声音不够大. 准备好了. 声音不够齐. 所以呢,有一次老师到田地里头去,听到一个声音,从草丛里头发出来的,那个声音亮得耳朵耳膜 ...

  • 《轻松学名方 (十六防风通圣散》4

    所以一般我们的不是摸到那个脉象,不是壮实有力的,我还不轻易用. 壮实有力有什么特点,舌尖一般是红的,所以有些患者他说,曾老师啊奇怪啊.我睡在床上,翻来覆去睡不好觉.舌尖一伸出来红红的,心火旺. 防风通 ...