著名心理学家艾森克论文60年后被撤稿,暴露出心理学研究怎么样的的弊端

时光的脚步刚刚迈入2020年,心理学领域就传出一个爆炸性新闻:《国际运动心理学杂志》(International Journal of Sport Psychology)宣布撤稿英国著名心理学家汉斯·艾森克的一篇论文。这一消息震惊全世界!

然而,由于中国出现疫情,又临近春节,此事并没有受到中国人应有的关注。没过几天,中国春节收官标志的元宵节刚过去两天,空气中的年味尚未散尽,SAGE旗下期刊《感知与运动技能》(Perceptual and Motor Skills)也宣布撤稿艾森克的论文3篇,提出存在疑问36篇;《心理报告》(Psychological Reports)同时宣布撤稿9篇,提出存在疑问25篇。

至此,作为世界顶级心理学家之一的艾森克,几十年前就已经发表的论文竟然被接连撤稿13篇,被指存在疑问61篇,其中部分论文甚至发表于60年前。
在心理学界如此重量级的人物,数量如此庞大的论文被撤稿和被质疑,不啻于一场人为制造的大地震,震惊了全球。
当初,艾森克以“地震”式的研究结论一震成名,60年后,又以“地震”式的被撤稿再次吸引了世人的目光,恰似中国60年一轮回的甲子纪年,艾森克开启了心理学又一轮的新篇章。

艾森克,相信每一个心理学人,对这个名字都不陌生。每本普通心理学教材中,都会出现艾森克的人格理论(Eysenck's Personality Theory)。即使你对这个名字并不熟悉,但是,你一定对下面这张图多少有点印象:

这是艾森克早期的人格二维理论,后来升级为三维理论。这一理论认为,人格包括内外倾、神经质、精神质。

艾森克和他的人格理论在很长一段时间内独领风骚,在绝大多数心理学教材中,都会用不小的篇幅介绍艾森克的人格理论和艾森克人格问卷(EPQ)。他的思想至今仍有很大影响力。

那么,艾森克的论文都有哪些涉嫌造假?在长达60年的时间里都发生了些什么?这一事件又能给我们带来什么启示呢?

01

鲜为人知的争议理论

或许许多人并不知道,艾森克更搏人眼球的其实并不是我们所熟悉的上述人格理论,而是他的另一个研究——他提出有一种癌症倾向的人格类型,叫做Type C人格,在这种人格特征上得分高的人往往就是消极面对压力的人。艾森克和他的研究者发现,这种Type-C人格相比于其他人更容易因癌症而死亡。最重要、更令人震惊的是,其死亡率居然高达121倍

在一个所有科学家都穷尽力气去寻找癌症的治病机理、努力开发有效药物的年代,在一个人格被认为是由基因所决定的年代,这一研究的发现简直就是一场影响力极大的“地震”。

在艾森克令人震惊的研究结论影响下,寻找和疾病相关的人格特征的研究在心理学界如火如荼的开展了起来。著名心理学家Johan Denollet提出了著名的Type D人格理论——从名字就可以看出艾森克研究的影响——专指那些经常郁郁不乐既不向好友宣泄也不在网上宣泄的人。Johan Denollet和合作者们发现,Type D人格的人往往更容易罹患冠状动脉心脏疾病。

艾森克当然也不是一个人在战斗。他也有一个合作者——德国的社会学家Ronald Grossarth-Maticek。事实上,Ronald Grossarth-Maticek是这些研究的核心,同时也是很多相关文章的第一作者——他是这些研究数据的收集者,他从前南斯拉夫和其所就职的德国海德堡获得数据。这位德国社会学家虽然在世界学术范围内并不怎么为人所熟悉,但是在德国却是家喻户晓。

艾森克和Ronald Grossarth-Maticek从80年代第一次见面以后,就开始合作,共同构建起Type C人格这一高楼大厦。他们的研究受到了极其广泛的关注。

但与此同时,质疑之声也甚嚣尘上——毕竟121倍的差异,也实在太大了,要知道,在那个时期,人格还被认为是由基因决定的,那些拥有这种人格特征的人几乎就等于被宣告了死刑。而更大的一波质疑,是关于艾森克和他的合作者另一个更令人吃惊的论断:他们甚至提出可以有效“影响”Type C人格者,从而提升他们在癌症中的存活率。

与艾森克这一研究的遭遇相同,在一段时间内,Johan Denollet的Type D 人格研究也遭受到学界相当程度的质疑。

然而,与艾森克的Type C人格研究的结局完全不同的是,Type D人格研究的结论不断得到众多后续研究的验证,逐渐成为了医学心理学领域一个非常具有影响力的经典理论。事实证明,Johan Denollet的Type D人格研究当时只是受到了艾森克相关研究的牵连——人们因为质疑艾森克,于是很自然地也就把这种质疑同时指向了到了带有浓厚模仿色彩的Type D人格研究上了。

02

权威的研究结论与不知名质疑之间的PK

艾森克和他的合作者关于Type C人格的研究,从论文发表开始就受到了不小的质疑。

最具有代表性的,是Pelosi和Appleby在1992年提出的,他们和各位读者一样,都被这个惊人的Type C人格理论和它神奇的功效所震惊。他们仔细查验了艾森克和他的合作者所提供的关于样本的数据和统计检验步骤,发现了不少不完善和不一致的地方。一方面,相关样本和统计方法的描述非常模糊,甚至连一共进行了几次调查,都没有清晰描绘;另一方面,他们的文章也有离奇的不一致之处——他们描述样本时,提到有192被试,而最后的结果却只有192被试。

Pelosi和Appleby当然不是唯一质疑的学者。因为艾森克和他的Type C人格理论是如此让人惊讶,以致于不断有研究者试图重复他们的实验结果。可惜,这些重复的结果无不以失败告终。

汉斯·艾森克│图片来源:Wikipedia

例如,在人格心理学家Amelang的两次重复实验中,利用比较大样本的被试群体,和较为先进的心理统计技术(因子分析和logistic回归),他们并没有发现所谓Type C人格与其他人格的独到之处;更为奇怪的是,他们也根本没有发现具备这一人格特征的人相比于其他人有更高的致死率。

重复实验所得出的结论与艾森克的研究结论有如此巨大的差异,表明艾森克的研究过程很可能存在问题!而其他希望复制艾森克和他合作者这一神奇人格理论的尝试,也总是以失败告终,致使对艾森克研究的质疑声越来越大。

由于众多反对和质疑的声音,Type C人格理论并没有在学术界掀起太大的波澜。然而,由于艾森克本人在心理学领域的影响力,以及“地震效应”,仍然有研究持续引用他们的发现:有元分析会将这些“震惊结果”纳入考量,也有教科书强调“高致病人格”的存在。

2010年,作家Buchanan发表了艾森克的传记,在书中他对艾森克的某些研究结果提出了质疑,特别是指出了其中存在的利益关联——艾森克和他的合作者Ronald Grossarth-Maticek,长期受到英国和德国烟草公司的资助因而他们可能因此具有强烈的动机,把癌症的死亡归因于某一种人格特征,而不是被大众所熟知的长期吸烟

非常遗憾的是,这本传记也没有得到心理学界太多的关注。

2019年,Pelosi再度发声,在临床心理学领域顶级期刊上发表了一篇极其犀利的评论文章,不仅综述了之前对于艾森克的研究科学性和伦理的质疑,而且直接呼吁相关部门对这些研究的真实性展开调查。

文章强调,是时候纠正这些疑似的不可靠结论了——已经有充分的证据证明这些结果很不可靠。如果放任其留在学术期刊上,则可能严重影响心理学家和公众对于相关问题的认知。该杂志的编辑David Marks也要求彻查艾森克的61篇相关论文。

文章一发出,立即引起了心理学领域,特别是临床心理学和人格心理学领域的强烈反响。艾森克生前所在的伦敦国王学院这才给予重视,立即开始调查,并生成了详细的调查报告。调查报告指出,艾森克26篇文章的结论是“不安全的”(unsafe),并且表示在可能的条件下将寻求撤稿这些文章。这实锤证实了,艾森克的相关论文涉嫌造假!

03

艾森克论文造假被撤稿事件的反思

艾森克论文造假60年后被撤稿,充分证明了“实践是检验真理的唯一标准”,不管多么权威,不管过去了多少年,只要脱离了事实,终将纸里包不住火。

从2011年那篇臭名昭著的"预知未来"研究和被发现作假的荷兰心理学家Stapel开始,心理学界就开始了一场轰轰烈烈的自查自清行动,要求开放科学(Open Science),艾森克的被撤稿事件与此不无关系。这表明,科学心理学的研究正在朝着追求更严谨、更可靠的方向前进。

但是,我们更想搞清楚,为什么心理学研究不断出现论文造假?根源是什么?如何从根源上杜绝心理学研究的论文造假?

如果不进行对心理学研究论文造假根源的研究,心理学研究的方法不改进,那么,论文造假事件,艾森克当然不是第一个,但也绝不会是最后一个。因此,艾森克论文被撤稿事件应该引起学术界对研究方法及论文发表程序的深刻反思。

反思一:

科学的一个重要特征是可重复性。假设设定一个首发论文验证流程:发表的研究论文分为两个阶段,第一阶段为创新或创造性首发,首发的论文不作为结论,只作为创新或创造性探索;第二阶段为大批同行跟进研究验证,跟进研究者必须是独立于首发者及其单位的第三方,不得与首发有任何人事及利益上的关联。跟进验证的论文只有一定数量后,首发的创新研究才能作为正式研究成果,而且必须附上跟进验证研究的相关论文。这样,是不是就可以最大限度地防止造假论文的出现了呢?

反思二:

科学的另一个重要牲是逻辑性。那么,凡是符合逻辑的方式都应该属于科学的范畴。弗洛伊德通过逻辑分析,创立了精神分析学说,尽管许多内容并没有得到实验验证,但如今已经没有多少人怀疑它的科学性了。那么,那些从实践中归纳总结来的知识体系,当然也应该被纳入科学的范畴,比如中国古代圣贤归纳总结的中国古典心理学。

反思三

科学的第三个特征是唯一性。这个标准值得商榷。宇宙本是多维的,科学怎么就成了一维的了?这科学吗?人类知识有两个来源:一个是通过长期的观察、归纳、总结出来的,比如天文学、中国古代文明智慧;另一个来源才是所谓的“科学”。但如果把科学定义为唯一的,那么,天文学也就不算科学了,哲学也不是。但是,我们需要思考的是,人类知识真的有必要如此划分么?

反思四:

心理学研究其实早就已经证实,通过实验研究人的心理,存在天然的缺陷,不可避免的会引起根本性的系统偏差。自我预言实现效应、旁观者效应必然会对实验设计者、实验操作者、被试等各环节产生奥妙的影响。因此,心理学实验一定会受到实验设计的者理论假设、宗教信仰、思想观念、价值观、利益等因素的影响;实验过程中,也难以避免实验者预期对实验过程产生的影响,甚至出现人为造假;而实验环境也一定会对被试产生微妙的影响,毕竟,人是有思想的有主观能动性的,不可能不顾及到自己其实是处在一个隐性的透明环境中,自己的一举一动都会被别人看到,即使是“双盲实验”也无法消除这一影响。这才是心理学实验研究必须正视的现实和必须解决的根本问题!

反思五:

事实上,人类心理学其实有两个来源,一个是来源于长期社会实践总结的心理学,例如中国古典心理学,这是古代圣贤通过从现实社会中得到的大数据统计分析归纳总结出来的心理学;另一个才是以实验研究为核心的西方科学心理学。科学心理学的研究不断出现丑闻,并不仅仅是个人素质问题,更深层次的原因是关于心理学研究方法的根本性问题。从实践中归纳总结出来的不算科学不是问题,是不是可以运用于指导实践呢?为什么在社会领域可以,到了心理学领域就不行了呢?这是不是一种认识上的偏差呢?中国古典心理学被视作非科学,相关研究几乎空白,这是不是中国心理学研究的重大失误呢?

建议:

艾森克论文撤稿事件的影响仍在持续,但愿这一事件可以引起心理学界对心理学研究方法的重视,着手心理学研究方法体系的重建,促使人们重新审视实践总结与实验验证在心理学研究领域的作用和价值,重视对中国古典心理学的研究,以及两者之间的对比性研究。

对于科学心理学来说,倡导更严谨、更规范化的科学研究,鼓励对于经典实验进行"重复研究"以检验其可靠性,同时鼓励开放数据集、透明化研究方法和分析流程,都非常重要。正是这一认识逐渐成为学术主流,才使得Pelosi在2019年的呼吁和以往任何时候不同,获得了广泛的关注和最终权威机构的介入。

对于心理学来说,研究方法可以分为两个方向,一个是通常所说的科学心理学方向,一个是中国古代圣贤的历史传承与社会实践相结合的归纳总结方向。从历史经验教训与社会实践总结而来,又经历了漫长的社会实践检验的中国古典心理学理论及研究方法,相比于实验室研究的方法,不受研究方案及实验本身对被试的影响,更接近真实,因此理应成为现代心理学的重要组成部分。构建中国心理学,理应建立在中国古典心理学理论基础之上。

作为心理学家,我们的目标是更好地理解个人、理解社会,从而帮助人们更和谐的相处,更好的适应社会,实现自我的更大价值,更幸福的享受生活,构建和谐美好的人类命运共同体,让人类拥有更美好的未来。

这一过程中,严谨的方法和统计,开放共享的心态一定是必不可少的;同样,古典心理学理论和研究方法同样是不可或缺的,而且,应该重视心理学的实验室研究与来源于无数代圣贤对社会实践总结的中国心理学的对比研究。

如果真的有人能予以关注并付诸行动,那么,艾森克论文撤稿引发的这场地震,对于心理学的发展来说,绝对算得上是好事情!

(0)

相关推荐