抛弃人性的历史学没有存在价值——“大数据”“数字人文”以及历史地理信息系统在历史研究中的价值

本文作者成一农教授

摘要

当前,“大数据”“数字人文”和历史地理信息系统的建设以及利用它们进行史学研究,在中国史学界成为关注的焦点,并受到一些研究者的追捧。究其根源,在于“大数据”“数字人文”和历史地理信息系统在很大程度上满足了我国史学界长期以来对于史料的追求,以及部分研究者对历史学科学化的心理需求。但历史学的研究目的在于通过对历史的理解和解释形成历史认知从而预测和影响未来,而这些都是主观的、带有人性的,无论“大数据”“数字人文”,还是历史地理信息系统对此产生的影响都是非常有限的。研究中忽视主观性以及缺乏对人的关注是我国史学界长期以来需要正视的问题,同时我国史学界也缺乏对历史学研究目的、学科价值等问题的关心,在研究中也缺乏想象力,当前对于这些问题的关注更能促进历史学以及历史研究的发展。

关键词

数字人文;大数据;历史地理信息系统;历史学的科学化;科学主义

一、问题的提出

近20年来,随着计算机技术的发展、应用成本的降低以及日益渗透到社会、生活的方方面面,历史研究也不可避免地受到了各种计算机技术的影响。大致而言,目前历史研究中主要讨论和应用的“技术”大致有三种:第一种“大数据”,即数据(即史料)的大量、多样、高价值以及处理方面的高速。第二种“数字人文”,对此目前缺乏明确的定义,大致可以归结为用计算机或者智能技术的手段来重新定义、提出以及解答人文问题。第三种就是历史地理信息系统(HGIS),即将历史文献空间化,并用地理信息系统及其空间分析的手段来发现和解决一些历史问题。

严格来讲,这三者都不是单一“技术”,而是各种技术的整合,或者是各种计算机处理数据方式的整合。大致而言,“大数据”偏重于“数据”的管理、加工和检索,“数字人文”偏重于数据的分析,历史地理信息系统则偏重于用“空间”来管理、整合和分析数据。且上述三者之间也不是完全可以明确区分的,如历史地理信息系统可以被看成为整合大量数据的一种方式,从而类似于“大数据”;由于其具有强大的数据分析功能,因此也可以被看成是“数字人文”的一部分。同时,“大数据”也囊括了对数据的分析,而“数字人文”的分析也需要建立在海量数据基础上。对于概念的分析不是本文的重点,因此此处只是进行一些基本的介绍。

随着这些技术的运用,很多学者撰文认为这些新“技术”的引入,将会极大地推进历史研究的进步。如关于“大数据”,郭辉就提出“大数据不仅给史学研究提供了新方法,也拓展了史学研究的领域。传统的史学研究同样需要收集数据,但因技术水平和技术条件的限制,往往只能使用采样的方法,力求利用最少数据获得最多的信息。如此,数据失真的可能性就较大,采样方法虽被诸多学者证明有其科学性,但相较于大数据提供的海量信息与科学分析而言,显然不具优势。许多以往无法研究的课题和领域,大数据时代皆将变得可能。长时段、全国乃至全球、宏观的话题处理得当皆能纳入研究者视野,更不用说诸多跨学科课题也将应运而生”。虽然“数字人文”在侧重点上不同于“大数据”,也绝不仅仅是史料的数字化,但目前国内“数字人文”的研究尚未超出上述范畴太多,因此学者对“数字人文”研究价值的认知也基本局限于这一范围,如王开队基于区域史的研究,认为“囿于历史文献自身特点及研究方法等,‘碎片式’研究是当前区域史研究中的主流。作为国内区域史研究的热点,目前徽学研究中的‘碎片式’研究主要包括大量的个案研究和专题研究两个方面,这是构建中观、宏观综合性研究的重要基础。解析徽州区域历史文献,我们发现其具有类型多样、内容丰富、系统完整的特点,而限于技术手段,目前对其整体性利用尚不充分。以区域史研究的基本任务为导向,借助现代数字人文技术,通过专题性数据库和综合性数据库的建立,挖掘徽学文献的系统性和关联性等,对‘碎片式’的文献与研究进行有机缀合,有助于全景式徽州区域成长史的建构”。关于历史地理信息系统,张萍提出“历史地理信息系统建设是信息化时代学术发展的要求,也是历史研究向纵深方向拓展的体现。作为历史信息存储、显示、管理、分析系统,近年来,国内相关数据平台越建越多,地理信息系统(GIS)对中国史学研究的贡献也初见成效,在历史气候、河流地貌、市镇经济、乡村聚落、水利社会、环境变迁、古代城市、古地图以及历史地理信息系统研究方法等九大领域都有突出的表现。GIS进入中国史学研究领域不仅带来研究方法的变革,同时也使历史研究理念更新,促成历史文献、古地图、遥感影像、考古信息等多元史料的应用,帮助我们完成一些动态追踪与多要素综合性研究”。

更有学者提出,这些技术的使用,将引领历史学的研究进入到新时代,如早在2005年黄一农就提出了“E考据”,即希望在文献数字化以及数据检索的基础上,进行考据,从而将史学研究引领进入到新的时代。

黄一农著《两头蛇——明末清初的第一代天主教徒》

与此同时,也有一些学者对于这些“技术”能否推进历史学的发展持保留态度。其中比较有代表性的有:作为国内较早进行史料数字化的陈爽,在《回归传统:浅谈数字化时代的史料处理与运用》中提出:“傅斯年先生曾提出‘史料即史学’的著名论断,界定了史料在史学研究中的核心地位。当我们借助现代化的电脑网络技术用在一定范围内‘穷尽’史料之后,史学研究所面临的主要问题,就不再是辛苦爬梳寻找资料,‘动手动脚找东西’,而是对史料进行科学鉴别筛选和分析排比,在这个过程中,学者个人的史学修为和学术功力显得尤为重要,这需要通识,更需要见识。从占有史料,到驾驭史料,我们还有很长的路要走。”如果陈爽认为“技术”在处理史料方面存在局限的话,那么包伟民则更是进一步提出:“总之,正如王家范先生所指出的,‘世界上有一种职业是任何再先进的机器人也无法替代,那就是历史学家’。对于史学研究来说,‘大数据’只不过是一种新的更加有效的工具而已,它当然不可能取代学术研究的主体——历史学家”,也即历史研究是一种具有主体性的研究。有着类似观点的还有李剑鸣和王子今等。

上述学者对于问题的分析,基本是从以下两点入手的:第一,技术在处理复杂的历史数据方面存在局限;第二,历史研究是一种具体主体性的研究,需要人对历史的理解以及人对历史进行解释,而这是计算机或者至少目前的技术无法达成的。

本人也曾经热衷于史料的数字化,且曾利用地理信息系统手段进行过研究,但随着学术研究的深入以及对史学认知的深入,越来越多地对“技术”能在多大程度上改变和推动我们的史学研究产生疑虑,甚至开始持否定态度。不过,本人虽然认为上述那些对“技术”保持警惕的学者的分析结论是正确的,但同时也认为他们的论证并没有触及根本,因为问题的症结不在于技术能给我们带来什么以及解决什么,而在于历史学研究的根本目的是什么?为了明晰这一问题,首先要分析的是,“大数据”“数字人文”和HGIS为何近年来能在我国史学研究中兴起,并被很多人所推崇。

本文作者著《古代城市形态研究方法新探》

二、“技术”在历史研究中兴起的原因

无论是“大数据”“数字人文”,还是历史地理信息系统在历史学研究中的兴起,实际上在一定程度上满足了我国史学长期以来追求的两点需求:

(一)穷尽所有相关材料

长期以来,或者至少自民国以来,尤其是傅斯年提出“史料即史学”,并提倡“上穷碧落下黄泉,动手动脚找东西”之后,史料在中国史学中的核心地位似乎就不可动摇。虽然傅斯年提出上述认知有着其时代性,但在这一理念的号召下,从民国开始,很多甚至可以说绝大部分中国史学的研究者就对史料有着一种狂热,热衷于对传统史料的挖掘和对新史料的追寻,一旦有新史料出现,大都会在学界引起一股热潮,典型者如以徽州文书为代表的民间文书、以清华简为代表的出土简帛,还有大量考古材料,以及近年来兴起的图像史学等等。

傅斯年

在中国传统史学中还存在另外一个长期被坚持的传统,即研究中应穷尽所有相关材料。而这一认知的根源则在于,由于认为“史料即史学”,由此“穷尽所有相关材料”,也就被认为可以在其所研究的问题上有可能会让后人无话可说,也就满足了一种不可名状的心理需求。

“理想丰满,但现实很骨感”,在21世纪之前,由于信息的不发达,查找、获得和阅读各类史料都需要投入大量的时间、精力和财力,“穷尽所有相关材料”似乎是一种难以实现的梦想;从20世纪末到21世纪初,随着传统文献的挖掘和新史料的出现,以及各大图书馆在线目录的推出,涌现出的可获得的海量文献,让史学研究者一时措手不及,“穷尽所有相关材料”更变得难以企及,由此“在某一问题上让后人无话可说”的心理需求也就极难得到满足。

在上述背景下,无论是“大数据”,还是“数字人文”,由于逐渐积累和汇集了海量的文献,其中不仅包括传统文献,还包括新出土的文献、图像等等,甚至囊括了某些图书馆所藏的全部文献资料,由此使得以往难以查阅的珍本、孤本文献变得随时可以阅览,这就让“穷尽所有相关材料”变得虽不能说是触手可及,但已遥遥可见。更为重要的是,这些数字化史料中的很多是可检索的,虽然检索词的设定需要一定的史学功底,以及需要对相关问题的深入研究,但“检索”本身就已经让“穷尽所有相关材料”成为了一种似乎可以达到的目标,由此满足“在某一问题上让后人无话可说”的心理需求,似乎不再那么渺茫。

总之,“史料即史学”以及“穷尽所有相关材料”的史学传统,是“数字人文”“大数据”一经提出就在中国史学界引起广泛关注的重要原因之一。虽然至今不少学者对“数字人文”和“大数据”依然持疑虑态度,但不可否认的是,检索“四库全书”“基本古籍库”等数字史料库目前已经成为史学研究必不可少的“能力”。

这里需要补充的是,本人不同意之前提到的学者提出的由于历史数据的复杂性,因而各种技术不能很好地挖掘和处理文献数据的观点。理由如下:

虽然越来越多的学科已经意识到了“大数据”时代的来临,但很多历史研究者强调由于历史文献的特殊性,即繁体字、大量手写文献、异体字、古文、缺乏标点等,历史数据的全面数字化(指的是扫描为可检索的文本)在可见的未来是不可能的。确实,虽然目前繁体字识别技术已经比较成熟,但基本针对的只是较为规范的印刷体,对于大量的手写、碑刻文献几乎发挥不了太大的作用,因此在众多古籍被“数字化”的同时,大量民间文献、档案材料、碑刻材料以及抄本古籍没有实现可检索,这点确实在当前阻碍了历史研究进入到真正意义上的“大数据”时代。不仅如此,对于现代汉语,虽然已经存在有着一定成熟度的语意识别技术,由此可以自动抽取所需的相关信息,但由于古文缺乏标点,其语法和句法与现代汉语差异极大,由此使得现代汉语的语意识别和信息提取技术几乎不可能直接运用于古籍。更为重要的是,语言的复杂性,使得某一问题的相关史料通常是多维度,即使实现了古汉语的语意识别,但要全面挖掘与某一问题相关的多维度的所有史料也是不太可能的。上述几者结合,确实使得很多历史研究者对“大数据”和“数字人文”持保留态度,如前文提及的陈爽和包伟民等。

但是,近几年人工智能(AI)的发展将会彻底改变上述状态。2016年和2017年,Alpha Go在围棋的人机对战中先后战胜顶级棋手李世石和柯洁,这在人工智能技术的发展中具有划时代的意义。与1997年“深蓝”战胜卡斯帕罗夫相比,Alpha Go对于人类棋手的胜利,不再仅仅依赖计算机的计算优势(以及人工对计算机运算的干预),而是在学习围棋规则的基础上,通过自我学习来实现“智能”,从而单纯以“智能”的形式战胜人类顶尖棋手。目前这一技术已经被拓展应用于软件开发等领域。更进一步就是,目前正在进行开发的就是训练AI在以“星际争霸2”为代表的计算机战略游戏上与人类进行对抗,即训练人工智能在信息大量缺失的情况下,完成信息搜集、形势判断以及制定策略等工作。

古汉字的识别,无论是手写材料还是碑刻材料,实际上都可以提出一些原则,虽然这些原则有时会有着模糊的边界,但可以通过反复试验,让AI进行自我学习,并在期间进行适当的人工干预,从而实现对各类字体的人工智能识别。与此类似,古汉语的语法虽然与现代汉语差异极大,但同样也可以提出一些基本原则,而这些原则甚至比汉字的书写更为规范,因此同样可以通过相似的自我学习的方式实现对古汉语语意的智能识别。只是目前上述两者缺乏“实用”价值,因此尚未纳入到当前人工智能关注的领域。

以这两点为基础,结合目前日益成熟的语意发掘技术,那么对历史文献的语意发掘也就水到渠成,多维度的史料挖掘也必然会实现。因此,在不久的将来,历史研究中材料的搜集、处理将不再是困难的事情。此外还需要提及的是,以量子物理学为基础理论研发的“量子计算机”已经开始投入商用,其计算能力远远超出现有的计算机。“量子计算机”加上AI,将使得计算机的学习能力变得极为强大。

不仅如此,一些考据性的研究和文献整理同样有可能提出一些原则和方法。与人脑相比,人工智能更为理性,且有着更为强大和几乎无差错的记忆能力和处理极为庞大的材料的能力,因此其不仅可以对数据进行“正确”的检索,甚至在未来还可以在一些原则指导下进行基于史料的考订工作。而且,按照下文分析的某些研究者所认为的,即历史学可以科学化,建立起一套可以验证的方法、程序,那么到了这一天,AI似乎就可以代替人进行历史研究了。

有学者依然会坚持,即使到了那个时代,人工智能也无法正确处理如此复杂和多样的历史资料,但问题在于对于如此复杂和多样的历史资料,人脑能否达到百分之百的正确呢?显然也是不可能的,因此我们也不能苛求人工智能在文字识别、语意识别以及“考订”方面达到百分之百正确。

不过需要强调的是,这些工作都是在建立一些原则和方法的基础上进行的,如果这些原则和方法被放弃,那么这些计算机进行的研究工作也就会被质疑甚至被放弃;而且在那些不接受这些原则和方法的研究者中,计算机进行的这些工作也是不会被接受的。

因此,本人确实认为在未来“大数据”“数字人文”等技术将会在史料的挖掘,甚至考订“史实”的研究层面带来彻底的变革。但问题在于,历史研究的目的就是基于文献的“史实”考订,或者复原历史真实吗?

(二)历史学的科学化

“历史学是科学吗?”这是一个长期困扰中国史学的问题。虽然对于这一问题一直存在持续不断的争论,但不可否认的就是中国史学领域的一些研究者坚持认为历史学应当是科学,或者应当朝向成为一门科学发展。在坚持历史学应当科学化的研究者看来,历史学科学化的瓶颈之一在于史料,即或者由于史料的多样性使得无法使用“科学”的方法来对其进行处理,或者由于史料的缺乏,由此造成无法使用那些“科学”的方法来分析数据。

无论是“大数据”,还是“数字人文”以及历史地理信息系统的引入,一方面,使得数据的缺乏不再是运用“科学”方法的瓶颈;另一方面,由于通过加工数据使得数据具有“一致性”,因此众多学科的“科学”方法可以被平滑的运用到史学研究中,由此至少在表面上使得史学研究看起来与某些社会科学类似,也使得历史学似乎有可能成为一门科学。

基于此,一些学者提出“大数据”“数字人文”将使历史学成为一门科学,其中典型的就是李伯重的《大数据与历史学科学化》一文。在该文开始部分,李伯重提出:“历史学是科学还是人文学知识?现在的趋势是越来越多的人认为是科学。今天的历史学,虽然不像社会学、经济学那样是一门完全的社会科学,但也越来越科学化。科学化的历史学,是用科学的方法研究历史。历史学的科学化有两个方面,即史料学方面和方法论方面都要科学化。这两方面都做到科学化,历史研究才能成为历史科学。”在该文后续部分,李伯重强调的就是通过“大数据”对史料的发掘,可靠的史料在数量上急剧增加,由此使得定量研究成为了可能,历史学的科学化就成为了可能。总体而言,李伯重认为的历史学科学化的基础就是历史学是一门基于史料发现史实(或真相)的学科。

李伯重

梁晨等的《量化数据库与历史研究》虽然没有直接探讨历史学的科学化问题,但他们在文中将人文社会科学的研究分为“求是型学术”和“解释型学术”,且希望通过对量化数据库以及相关分析方法的使用,使得史学研究偏向于“求是型学术”发展,也即走向社会科学,“我们认为,提倡依托于大规模量化数据库的学术研究,对推动整个人文社会科学的‘求是型学术’、真正认识中国社会和历史发展的特征、平衡东西方学术见解意义重大。人文社会科学注重‘解释型学术’的传统,使得各学科在资料收集方面往往不断确认‘已知’而轻视探索‘未知’。历史学科的‘选精’、‘集粹’如此,当前社会学科中较为普遍和‘科学’的统计抽样调查等方式亦是如此。尽管在数据收集的功效和人口层面的代表性等技术层面,统计抽样社会调查有其得天独厚的优势,但由于西方理论范式先行,我们在中国实施抽样调查项目往往仍需要大量借助西方已有研究经验,通过研究直觉提出问题和设计问卷时,难免会受到西方‘已知’事实和理论的影响。诚然许多重要研究成果确认或修正了东西方‘共性’的认识,但我们也在一定程度上丧失了认识中国‘未知’特质、完善和平衡国际学界对不同社会差异根本认识的可能。不论是历史还是当代,基于档案等人口层面系统记录的大规模量化数据库,无疑成为弥补当前这一研究缺憾的最佳选择。这种以注重材料、探求事实为先的‘求是型学术’,必定会促进我国历史学科乃至整个人文社会科学平衡、健康、全面地发展,也会为国际学术进步提供丰富的‘中国经验’”。这段论述中最为核心的问题就是其对“求是型学术”和“解释型学术”的认知,即“求是型学术”的重点是发现“未知”,而“解释型学术”目前的研究偏向于确认“已知”,从前后文来看,作者在这里提出的“未知”和“已知”显然针对的是“事实”,但如果抛开“事实”,“解释型学术”不也是发现了那些人类社会发展、变化的动因、规律等具有主观性的“未知”吗?而且更为重要的是,历史研究的目的就是发现“事实”上的“未知”吗,也即历史研究属于“求是型学术”吗?以及最为重要的,由此走向社会科学的历史学是对历史学学科的促进吗?

当然,如果从发现“未知”的事实角度而言,确实“数字人文”“大数据”以及历史地理信息系统会促进历史学的“科学化”。在这里,我们回到了本节上一部分最后提出的同样的问题,即发现事实(也即考据)是历史研究(历史学)的目的吗?

梁晨等著《无声的革命:北京大学、苏州大学学生社会来源研究,1949-2002》

三、历史研究(历史学)的目的

上述两点分析最终指向的症结就是“历史学的目的是什么”。对这一问题的回答也就决定了“大数据”“数字人文”以及历史地理信息系统在历史研究中的价值。

虽然后现代史学在中国史学界依然受到各个层面的质疑,但不可否认的是,当前主流的历史学家已经承认通过文献考订我们是无法复原史实的。如果我们承认无法复原史实,那么如何判断我们所谓“不断深入的、运用了更多文献”的研究以及用“定量”以及“科学”方法进行的考订是接近还是远离了史实?因此,从这一层意义上,傅斯年的“史料即史学”已经过时了,而梁晨提出的历史学属于“求是型学术”也需要商榷。所有文献和考据方面的努力所能达到的只是让我们的研究更具有说服力而已,但“具有说服力”并不等于“史实”,如果套用法律术语,就是这样的研究能达成的只是证据真实,而不是事实真实。因此,仅是从发现未知的事实角度而言,“数字人文”“大数据”以及历史地理信息系统促进历史学的“科学化”,也必须加上“表面上”这一限定词。如果认为历史学作为学科与众不同的力量在于“真实”的话,那么这种认知应当更正为历史学的力量在于“让其他人、或者其所针对的对象或者大多数人认为这是真实”,由此注定历史学不可能成为一门通常意义的科学,不过就这一点而言,“数字人文”“大数据”以及历史地理信息系统确实可以增强历史学的力量。

但无论是获得真相,还是“让其他人、或者其所针对的对象或者大多数人认为这是真实”都属于历史学的力量,而不是历史学的目的。要界定历史学的目的,最为重要的就是要界定历史的作用。人类几乎所有的决定,上至国家层面的政策的制定、决议的形成,小至个人的在早市上选择购买的蔬菜,从本质上都是在对“历史”的研究(或通俗的说就是“经验”)的基础上,形成了影响未来“历史”的决策,即在“让其他人、或者其所针对的对象或者大多数人认为这是真实”的基础上形成“历史认知”,由此来预测和影响未来。在目前史学界,认为“历史认知”可以绝对“客观”以及能做到“客观”的人应该是不多的,我们不得不说任何“历史认知”都是主观的,由此通过人类的主观认知,使得过往的历史与未来建立起了不可分割的联系。

举一个股市的例子,自股票市场创立以来,很多经济学家都会根据以往股市涨跌的数据,力图总结出股票本身涨跌的规律,也即提出一种历史认知,以有助于今后股市的操作。如果某一规律提出后得到普遍的认同,那么在当时及后来的股市操作中,这些规律就会成为很多人的操作指南(也即“让其他人、或者其所针对的对象或者大多数人认为这是真实”),由此自公式提出后的股市的涨跌就很难分清是股市自身规律的作用,还是由于人们遵守基于主观认知的涨跌规律而进行操作的结果。

再举一个历史学方面的例子,辛德勇的《制造汉武帝:由汉武帝晚年政治形象的塑造看〈资治通鉴〉的历史构建》一书,解释了司马光在《资治通鉴》中对汉武帝形象的塑造,也就是说其揭示以往我们关于汉武帝的“历史认知”是司马光塑造的,偏离了历史事实。不过,这一“历史认知”自《资治通鉴》成书以来,影响了后人对汉武帝的认知近千年,在这近千年中这一对汉武帝的“错误的”“历史认知”影响了很多人基于对汉武帝的认知而进行的历史活动,也就是这一对汉武帝错误的“历史认知”影响了“历史”的发展。在这千年的历史中,对历史进程造成重要影响的不再是那个真正的汉武帝,而是关于汉武帝的“历史认知”,虽然这一“错误的”“历史认知”来源于真实的汉武帝。

辛德勇著《制造汉武帝》

这样的例子在历史中数不胜数,如康有为的《孔子改制考》通过形成对孔子新的“历史认识”,从而为其所主张的变法建立思想理论基础,由此对“历史”的运行产生了影响。同样在这一“历史”的形成中,对孔子的“历史认识”的影响力是要大于真实的孔子。

因此,虽然“历史”与“历史认知”是可以区分开的,但在两者的形成中,是互为因果的,相互影响的。自诞生人类意识后,人类的历史就受到人类意识的影响,虽然自然会对人类历史产生影响,但这些影响很大程度上也可以认为是通过人类意识才对人类历史施加了影响。由此,历史学和历史研究的目的也就清楚了,即通过研究由人类意识产生的历史认知,并希望由此影响未来的人类历史的进程,当然历史研究本身也是一种历史认知。需要说明的是,这并不完全等同于“以史为鉴”,因为“以史为鉴”的重点在于“鉴”,而忽略了对于历史认知的强调。

康有为著《孔子改制考》

那么,在这一目的实现过程中,“数字人文”“大数据”以及历史地理信息系统是否能起到决定性作用呢?显然不能。第一,“历史认知”是高于“让其他人认为这是史实”的,是在“让其他人认为这是史实”基础上提出的更为主观性、目的性的叙事。简言之,首先,“历史认知”具有目的性,没有目的性的纯粹客观的“历史认知”是不存在的。即使前文提及的对股票涨跌规律的认知也是如此,其中涉及对用于计算涨跌规律的因素的选择、对这些因素不同重要性的认知等等。其次,在构建“历史认知”时,不是所有“史实”或者“让其他人认为这是史实”的内容都是重要的,而是要基于目的进行有意无意的主观选择。因此,“历史认知”具有强烈的主观性,是人为的。第二,基于历史认知对未来人类历史进程的影响同样具有强烈的主观性,因为人们在“以史为鉴”时,面对各种历史认知,在进行选择时就具有明确的主观性。显然,对于上述两点,无论是“数字人类”“大数据”还是历史地理信息系统都是无能为力的,因为它们是“技术”、是“科学”,而缺乏人性、缺乏主观性。当然,换个角度而言,“追求用科学的方法”进行历史研究也是一种主观的、人性的,因此本人对此也不是排斥的。

为了便于理解,在这里举两部科幻小说的例子。首先,就是著名的科幻小说作者艾萨克·阿西莫夫的《银河帝国》。小说中的重要人物谢顿提出,虽然个人的心理及其活动是无法预测的,但人类群体的反应却能以统计方式处理,且群体的数目越大,统计性的预测就越为精确,并可以用数学公式来预测,由此开创了“心理史学”,而且在小说中,“心理史学”确实也顺利地预测了一段时间内人类历史的进程,且那些从事心理史学研究的人也成功干预了人类历史的进程。这岂不是非常类似于“科学化”之后的历史学。不过在小说中,作者为心理史学的成立设定了一个有意思的前提,即被预测的“人类不得预知心理史学的结论”,这一限定,实际上使得进行“心理史学”研究、预测和改变历史的那些人超越于绝大多数人类之上,在某种意义上成为了“上帝”,而“人类”则成为了按照既定轨迹前进的“机械”。如果有一天这变成了现实,那么这是历史学和人类的胜利,还是悲哀?在小说的后半部分,作者实际上放弃了这一想法,将“心理史学”降格为试图让人类和平发展的智能机器人不成功的尝试之一。

艾萨克·阿西莫夫

还有就是刘慈欣的短篇小说《镜子》。作者假设,随着物理学和超弦计算机技术的发展,物理学家验明了宇宙大爆炸之初形成的一些物理参数,同时超弦计算机可以储存和计算自宇宙大爆炸以来的所有数据。在不经意之间,某人利用超弦计算机通过穷举法计算出了能使得宇宙演化至今、且与今天的宇宙一致的那些宇宙大爆炸之初的物理参数的数值,由此,不仅可以计算过去每一时刻宇宙中每一位置发生的事件,而且还可以预测未来。从“数字人文”和“大数据”的角度来看,这应当是将历史学科学化到了极致,但这样被决定了命运的人类是否过于悲哀了呢?最终,小说中的人类也就灭亡了,因为没有了人性。

这两部科幻小说虽然认为“历史认知”可以是客观的,但前者实际上暗示如果如此,那么有着类似于“上帝”的存在,而后者更为悲观地认为这样会导致人类的灭亡。

刘慈欣著《镜子》

回到史学,很多中国史研究者至今依然认为王朝是中国历史的基本框架,且认为这是客观的、真实的,但真的是这样吗?中国古代的王朝通常认为始于“夏商周”,但问题在于,与“夏商周”同时存在的其他“国家”“政权”“部族”为什么不被算成王朝?还有我们经常提到的词汇“宋辽金”,但同时存在的“西夏”为什么不被纳入到这一王朝框架中?不仅如此,按照时间顺序应当是“辽宋金”,但为什么我们习惯于“宋辽金”?这里不讨论对错,只是指出其中的主观因素,当然对“王朝”的界定也会存在争议。不仅如此,为什么我们要以王朝为基本框架?请考虑中国通史甚至世界通史按照表1方式叙述的合理性。

表1  极简中国通史或世界通史

上述用这个简单表格所叙述的中国通史或者世界通史难道不存在合理性吗?“生存、吃饱、传宗接代”难道不是大多数人的基本需求吗?这样的通史在这一层意义上难道不具有更广泛的代表性吗?这里再引用一段科幻小说家的格言,田中芳树在其名著《银河英雄传说》中借主角杨威利的口说“这场战争只关系着国家的存亡兴衰,和个人的自由和生死相比的话,并不是什么大不了的事”。

最后,我们还需要反思为什么我们要使用各种“技术”使得历史学“科学化”?其中显而易见的原因,就是在很多人脑海中“科学”代表了“好”,但“科学”真的代表“好”吗?不是!当前国内外学界对于“科学主义”及其危害有着持续的反思,在此不再赘述。历史学之所以具有魅力,就是因为其是关于人性的学科,抛弃了人性,无情无义的历史学也就没有了存在的价值,就像前文提到的,未来完全可以用AI来进行处理,那么那时作为学科的历史学也就不存在了,也就没有了历史学家,而没有了历史学的人类也就没有必要存在了。

田中芳树著《银河英雄传说》

四、结论——历史学应该回归人性

至于技术所能对历史学进行的推进,实际上一些推动这些技术运用的人士已经给出了回答,如在“数字人文”领域具有影响力的徐力恒就提出:“数字人文可被定义为一套提出、重新定义和回答学术问题的更智能办法。所谓‘更智能’,不只意味着文科学者驱使数字技术(尤其是电脑数据库)作为外在的工具,来回答他们过去已经提出的学术问题;也应该包含学者由于受到数字技术和思维的影响,而提出新课题,甚至产生新的研究范式。因此,数字人文研究往往包含两个层面:一是学者一直在做的研究工作,例如对大量资料进行爬梳,找出有用的记载。没有数字技术,学者同样可以做得到,但技术可以帮助学者更有效率地执行这些研究的步骤。二是学者不利用数字技术就无法做到的一些研究工作,例如同时比对上千条数据,辨识其中模式。”也即只是局限于提出新问题、解答问题以及改进解答问题的方式,且从徐力恒认为“数字人文”包含的两个层面来看,改进解答问题的方式只是局限于对材料的处理;而发现新问题也局限于对现象的发现(即模式)。但显而易见的就是:对于历史学而言,更为重要的问题就是判断哪些问题是重要的;同时解答问题的方式也远远超出于对于材料的分析,通过分析材料就能回答的问题,在史学中基本不会是重要的问题,因为这样的问题基本属于“史实”层面。

本文并没有否定“数字人文”“大数据”以及历史地理信息系统在历史学研究中的价值,只是认为其价值只能局限在服务于考据、考订,进行相关性的分析以及发现现象上,而且即使在这些方面,也只能使得我们的考据更为精致化,并不能使得我们更接近于“真实”,而只是看起来更接近于真实。这种研究只是历史研究的基础,其虽然强化了历史学的力量或者说服力,但与达成历史学的目的并无直接关系。

历史研究目的在于解释,在于通过解释过往而影响未来,是主观的,是有目的性的,是有感情,是有人性的,如果抛弃了这一点,历史学成为了科学,那么历史学的末日也就到来了,人类的末日也就即将来临。

顺带提及的是,有人提出“数字人文会伤害人文学科吗”,在我看来这个问题本身就是错误的,因为“数字人文”当然不会伤害人文学科,伤害人文学科的只有我们自己,是我们自己放弃了主观性和人性,而屈服于科学和技术之下。

总之,对于历史学而言,技术不是救世主,历史研究的发展和变革在于作为研究者的我们自己,在于我们的人性。

最后需要提及的是,坚持历史学科学化的人,基本都认为历史学研究的目的就是真,也即通过方法、程序的科学化,或者说通过建立一套可以验证的程序与方法来追求真实的行为,历史学可以成为科学;且如果建立了一套可以验证的程序与方法的话,那么各种环绕史料的问题也会迎刃而解。但这一认知存在的前提是:首先,在历史学中建立一套可以验证的程序与方法的可能性,至少到目前为止本人还未见到有人对这一问题进行了论证清晰的研究。其次,建立这套可以验证的程序与方法的必要性,这点实际上更为关键,这个涉及对历史学学科目的的认知,而对此坚持历史学科学化的人基本认为历史学的目的在于求真,也即当认为历史学的目的是“求真”的情况下,才能谈得上用科学的方法,然而对于历史学的目的已经很多年没有进行过认真讨论了。

《数字人文》

而且,通过一套可验证的研究方法和研究规范来探求真相,这样的科学路径,似乎没有回答这样的问题,即:如何通过科学的方法来验证一套可验证的研究方法和研究规范确实可以探求真相,且虽然中间的结果不能保证正确,但这样的路径可以保证达成对真相的探求,以及我们探求的过程是在不断接近真相。如果不能回答这一问题,那么似乎这样的“科学”的基础是“非科学的”。类似一个问题就是,如何证明“通过标准的研究方法和研究规范探求到的真相就是真相”?如果不能恰当的回答这些问题,那么“科学”本身也是有局限的,有适用性的,只是一种认识方式。当然,现在不少坚持历史学科学化的学者以及研究科学哲学和科学史的人,也同意科学不能保证揭示“真相”,他们认为科学意识和行为更多的是一种认知方式或者研究范式,但他们同时坚持,与其他认知方式和研究范式相比,科学具有优越性;或者,在所有认知方式中,科学的方式是最有可能保证客观性的。但这里带来的问题即是,如何验证“科学是更好的认知方式”,以及如何验证“科学的方式是最有可能保证客观性,由此是更好的一种认知方式”呢?这里的矛盾在于,由于既然科学不能保证揭示“真相”,“非科学”同样不能保证揭示“真相”,都不能“保证”揭示真相,那么如何判断科学比非科学更能接近真相?如果“科学”的这种优越性只是来源于逻辑、方法层面的严谨,但逻辑、方法层面的严谨为什么就好呢?这样的论证可以简化为:科学的方法比非科学的方法好,所以科学比非科学好;而由于科学比非科学好,所以科学的方法比非科学的方法好,显然是一种循环论证。因此,上述只是简单讨论了目前关于历史学科学化的研究远远无法证明其所声称的学术价值,也没有在人类的各学科已经有了广泛发展的今天,重新讨论为什么历史学的目的就是“求真”。

[原文载于《清华大学学报》(哲学社会科学版)2021年第1期,作者:成一农,云南大学历史与档案学院]

(0)

相关推荐