闫坤如:数据主义的哲学反思
[摘 要]大数据的出现产生革命性作用,它引发认识论革命、方法论革命和价值论革命。在大数据革命的颠覆性作用下,数据主义正在日益兴起并且影响学者理解和对待世界的方式。数据主义的哲学本质是数据与世界同构,其哲学渊源来自于古希腊的毕达哥拉斯主义。数据主义是经验论的新形式,其基础背离人文主义的立场,其理论预设也站不住脚。为了规范数据技术的发展,必须维护人类尊严,确保人类的主体性地位,才能避免数据主义之殇。[关键词]大数据 数据主义 经验论 人文主义弗洛里迪在《大数据及其认识论挑战》一文中对大数据进行了定义:“大数据是从仪器、传感器、互联网交易、电子邮件、视频、点击流以及当前或者未来可用的所有其他数字来源产生的大型、多样、复杂、纵向或者分布式数据集。”大数据正逐渐成为现代社会基础设施的一部分,正在改变人类的生活方式,引发新的生产变革,进而影响到人类的知识体系、价值体系和理解世界的方式。大数据之父维克托·迈尔-舍恩伯格说:“大数据开启了一次重大的时代转型。”大数据的出现既能产生很大的社会效益,又改变了人类的知识结构与知识获取方法,引发了数据革命。一、数据革命及其影响大数据引发的数据革命具有颠覆性作用。大数据不仅仅引发社会革命和价值论革命,也引发认识论革命和方法论革命,它的出现不但改变了人类的生存状态、价值判断与利益诉求,而且改变了人类的知识来源和获得知识的方法与途径。大数据打开了世界观、方法论和价值观的新世界的大门,其带来的革命性影响主要表现为以下三个方面。(一)万物皆可数据化,大数据引发本体论革命大数据时代,数据化不仅仅是技术工具,更是一种全新的世界观、价值观和方法论。数据化的趋势,就是把自然界中的万事万物以及万事万物的关系都转化为可计算的数据。在大数据时代,自然界现象、人与自然关系以及人与人的关系都可以用数据来表达,数据因而成为人类社会和自然界的表征。大数据引发社会革命,社会正在被深度数据化。脸书、腾讯、微信等软件将人们的社会交往数据化,产生“社交图谱”。数据可以精准刻画人类生活轨迹和行为习惯。例如,购物网站可通过对个体购物习惯和购买能力等的分析来进行个性化推送。人类的经济活动、政治活动以及国际关系都可以用大数据来表征。在小数据时代,人的信誉、影响力、情感、行为等是无法量化的,它们是一种相对主观的模糊评判;在大数据时代,人类内在的情感、情绪、心理活动以及外在的行为都可以表征为数据关系,并且能够通过测量而进行准确的量化分析。在大数据时代,数据不但重塑社会关系,也带来了社会变革,人类生产方式、社会交往、支付方式、资本流向以及商业模式都发生了革命性变化。大数据时代,不但人的情感、情绪等心理活动和外部行为可以数据化,而且人与人的关系也可以数据化,甚至整个世界的万事万物都可以数据化,这引发对于数据的本体论地位的思考。(二)数据成为认识的新来源,大数据引发认识论革命大数据诉诸对数据的全样本分析来认识世界、获取知识,避免了理论反思与小样本分析的片面性和非代表性弊端。大数据改变了对知识的定义,除了创造新价值,还是人们获得新认知的源泉。基钦在《大数据、新认识论与范式转换》中提出大数据对科学、社会科学和人文科学的既有研究方法发起挑战,并带来新认识论革命。在大数据革命之前,科学研究起源于人类对于周围世界的惊异性,这种惊异性促使人类不断挖掘自然现象背后的规律,寻找自然现象背后的原因。人类通过经验的总结寻找内在规律,通过理论假设解释现象;通过提出问题、寻找问题的原因,从而对自然现象进行解释,在此基础上获得新知识。在大数据时代之前,获取知识的第一步就是要提出问题,例如 “天空为什么是蓝色的?”“所有天鹅都是白色的吗?”等等,然后带着问题去寻找世界的因果关联;找到了事物间的因果关联,就找到了问题的原因,也就获得了知识。在大数据时代,只需要知道“是什么”,而不需要追寻“为什么”。博伊德和克莱夫特在《大数据批判问题》中提出,“大数据在认识论和伦理学的层面带来了深刻的变化。大数据构建了关于知识构成、研究过程、我们应该如何处理信息、以及显示的本质和分类等关键问题”。大数据是人们获得新的认知、创造新价值的源泉,它对相关关系的追求引发了一系列知识的变革。从小数据到大数据不仅仅是技术工具的进步,而且带来了知识上的认识论转向。知识获取形态从简单的归纳转变为对于数据的挖掘、处理和分析。在大数据时代,人们只需对数据进行分析,而不必对数据显示的内容进行假设和检验,也不用赋予数据意义就能获得知识。大数据时代不需要问“为什么”,只需确保预测的成功。大数据引起知识来源革命、知识本质改变、知识内容革命、知识观念革命以及知识主体的改变,知识从挖掘世界的因果关系转变为分析数据间的相关关系;知识的不确定性取代知识的确定性;知识观念由真信念转变为可靠性。所以,大数据引发了一系列认识论革命。(三)数据成为价值评判新标准,大数据引发价值论革命数据革命不仅带来社会革命、认识论革命,还引发价值论革命。按照数据主义者的观点,任何现象或实体的价值就在于对数据处理的贡献,数据成为衡量经济财富、政治利益、国际竞争、社会关系以及价值诉求的评判标准。随着数据革命的发展,数据具有了价值。数据与阳光、空气、水、土地、森林、草原、矿藏等资源不同:资源具有消耗性,很多资源是不可再生的,但数据具有不可消耗性,可以被重复应用。在大数据时代,数据具有了资本和资产的属性,数据可以产生经济效益,可以用于投资获得利润。不但如此,大数据时代,掌握数据的数量和规模、数据处理能力高低也成为衡量经济实力的标准。如京东、阿里巴巴和亚马逊公司等网购平台公司掌握大量的消费数据;谷歌、百度和搜狗等搜索引擎公司掌握着大量的搜索数据,脸书、腾讯等社交网络平台收集了大量的社交数据。掌握的数据成为企业财富,数据公司垄断数据并通过运用和分析数据来盈利。大数据时代“数据为王”,谁掌握数据,谁就掌握着市场控制权,这些公司成为新一代“数据暴发户”。数据鸿沟正在拉大。数据分析和个性化推送正在干扰政治选举、消费行为和社会交往,对于数据的掌握和运用程度正在成为衡量一个国家、地区或者企业的新标准。大数据时代,流量为王,大数据正在改变和重塑人类的价值观,引发人类价值尺度的变化,导致主体价值多元化。例如在大数据时代,人类的隐私观念发生了变化,一些社交网络用户热衷于分享家庭住址、旅游地点、家庭收入以及其他个人隐私,空间隐私、身体隐私、知识产权隐私等传统隐私内容也在发生着改变。二、数据主义及其哲学本质(一)数据与世界逻辑同构,数据是世界的图像维特根斯坦在《逻辑哲学论》中提出语言与世界之间存在着逻辑同构性。世界结构中的“世界—事实—基本事实—对象”与语言结构中的“语言—命题—基本命题—名称”一一对应,正确地使用语言就是在正确地描述世界。数据主义者认为,“数据与世界逻辑同构”,世界上存在的任何事物和关系都可以通过数据关系来表达,世界万事万物都是数据。史蒂夫·洛尔在《数据主义:决策、消费者行为以及所有领域的革命》中称这种“万物皆数据”的思维为“数据主义”。通过数据可以重塑人与自然、人的生产生活、人自身的感情、情绪以及人与人之间的关系。数据是万物之源,数据正成为解释一切事物的依据,甚至数据之间的相关关系可以取代确定性领域的因果关系。数据主义还可以推进科学研究的转型,把人们从对因果关系的追求中解脱出来,转而把注意力放在相关关系的发展和使用上。数据成为解释世界、解决一切问题的新宗教、新神话,成为评判价值的新标准。以色列学者尤瓦尔·赫拉利在《未来简史——从智人到智神》中提出:“数据主义认为,宇宙是由数据组成的,任何现象或者实体的价值就在于对于数据处理的贡献” ,“数据主义将人类体验等同于数据模式”。数据主义改变价值评价标准,并形成新的评判价值的标准。数据主义认为,数据革命既具有颠覆性意义,又具有彻底性意义,促使以“人”为中心的世界观变成以“数据”为中心的世界观,并且人类历史就是数据处理的历史。不但如此,数据影响到我们理解世界的方式,人类情感也可以通过经由数据构成的复杂算法实现。自然界中万事万物都可以还原为数据,人际关系可以还原为数据,人的情绪、情感、心理活动也可以还原为数据。换言之,数据主义代表了还原论的新形态,世界与数据具有逻辑同构性,万事万物对应着数据,万事万物间关系对应着数据集。数据主义者认为,世界由数据构成,数据间的不同关联方式可以对应不同事物间的关系,数据与世界是逻辑同构的,数据是世界的图像。
[奥]维特根斯坦《逻辑哲学论》(二)世界的本原是数据数据主义者认为,在本体论层面“数据是世界本原”。“世界本原”问题是古希腊哲学家关注的核心哲学问题。古希腊哲学家在本原的规定中来阐释世界的统一秩序和社会的基本规范以及由此而导致的人生原则、社会规范,并解释世界万事万物的发展变化。古希腊哲学家把世界本原作为事物构成要素、原初状态以及事物发展变化的动因。泰勒斯认为世界本原为“水”,恩培多克勒认为世界的本原是“土”“气”“火”“水”四种元素,赫拉克利特把世界的本原归结为“火”,毕达哥拉斯把世界的本原归结为“数”,德谟克利特把世界本原归结为不可分的“原子”,等等,他们从不同视角寻找世界的来源与存在根据。到了大数据时代,数据主义者把“数据”作为世界本原,认为数据是数据时代万物的构成要素、运动变化动因以及存在的根据,可以解释世间万物。数据主义是古希腊时期毕达哥拉斯主义在人工智能时代的新形态。毕达哥拉斯认为“数是万物本原”,“科学的世界”和“美的世界”都由“数”组成,立足于用数学重构世界。毕达哥拉斯主义者力图用简单的抽象数学来解释纷繁复杂的世间万物。整个西方哲学和西方科学研究都受毕达哥拉斯主义的影响。柏拉图把“不懂几何者禁止入内”的警示高悬在雅典学院门口;哥白尼和开普勒通过计算宇宙间的数量关系得到“天体运行规律”和“开普勒行星运动三大定律”;莱布尼茨坚持宇宙是由数学和逻辑构成的和谐整体,他还发明了二进制,为计算机的出现奠定了基础。数据主义在人工智能时代还表现为计算主义。计算主义作为一种世界观和方法论,是认知科学和人工智能中的主流研究范式。计算主义把心理状态、心理活动和心理过程看成计算状态、计算活动、计算过程,主体认知同样可以进行计算。大数据时代,科学研究的概念框架、社会结构、制度安排、教育设置等都源于数据的产生和分析,人类的生产方式与思维方式、人类对世界的理解和认识都源于数据,世界可以被认识,万事万物只有通过数据才可能被认识,世界的本原是数据,数据主义成为智能化时代新的“宗教”。(三)数据主义是经验论的新形式经验论也叫经验主义,是与理性主义相对的一种认识论观点。理性主义认为,人类具有理性,能够透过纷繁复杂的现象看到事物的本质,能够总结出事物发展的规律,可以通过理性从有限现象推广到普遍规律。经验论认为,人类知识起源于感觉,感性经验可以获得知识,甚至把感性经验作为唯一的知识来源,这与大数据的相关关系可以取代因果性关联的数据主义观点一致。1998年图灵奖获得者吉姆·格雷把数据驱动的研究作为科学研究的第四种范式,“实验科学、理论科学和计算科学都受到数据泛滥的影响,第四种'数据密集型’科学范式正在出现”。吉姆·格雷总结出科学研究的范式有四种,分别是自然科学、理论科学、计算科学与数据密集型科学。格雷认为四种科学对应的四种研究范式是:实验研究、理论研究、计算机模拟研究、大数据驱动研究。从计算机模拟研究开始就已经有了数据主义的苗头,数据主义作为新的“宗教”,认为大数据的相关关系可以取代因果联系,大数据时代就是放弃对于因果性的追求。数据驱动的科学研究将取代理论驱动的科学研究,因此,在科学研究范式上,数据主义认为不再需要科学理论,宣告“理论的终结”。安德森在《理论的终结:数据洪流让科学方法过时》中提出,大数据让之前的科学研究方法过时了,数据驱动科学“这个过程是用现有的理论来指导知识发现的过程,而不是简单地希望识别数据集内的所有关系,并假设它们以某种方式有意义”。而与之相反的知识驱动的科学,使用一种直接演绎的方法,在理解和解释少量数据和薄弱计算机条件下的世界发挥作用,大量数据以及处理这些数据的统计工具的出现则提供了一种了解世界的全新方式。数据主义者认为大数据不是基于先验立场,不受先在理论干扰,大数据的全样本分析避免小样本的随意性,不具有人类偏见,超越了特定领域的知识。大数据彻底改变了我们对研究的看法,科学家不用构建假设和模型,通过数据采集和分析便可以得到科学结论。数据主义者认为,大数据不但是科学研究的对象与问题,更是科学研究的方法和工具。大数据既是科学研究的结果,也是科学研究的基础,这种经验主义的方法是基于数据与世界同构的假设之上,但数据与世界存在不可通约性问题,单纯依靠数据挖掘进行相关关系分析未必能够获得全部知识。数据主义者认为只要有了数据,知识自然而然会产生,但人类经验具有不确定性,数据也无法通过数据的相关性分析来解释一切现象。认为数据相关关系可以取代因果关系的数据主义观点是经验论在数据化时代的新形式。三、数据主义神话的破灭(一)数据主义的人文主义批判随着数据科学的崛起,让“数据主宰一切”的呼声高涨,数据主义欲颠覆人类近代以来建立的人文精神与社会秩序,形成“新人文主义”或者“后人文主义”。传统人文主义以“人”为核心建立世界观和价值秩序,而“数据主义”以数据为核心建立世界观和价值秩序;数据主义成为新的世界观和价值观,但数据主义与人文主义的核心内容和根本观点迥异。不但如此,数据主义挑战人文主义的世界观和价值观。人文主义者肯定人类价值,重视人类生命和尊严,关注人类命运和人类的生存状况,认为不是宇宙为人类生活带来意义,而是人赋予了宇宙存在的意义。早在古希腊时期,哲学家普罗泰戈拉就提出“人是万物的尺度”,是非善恶都是相对人类而言的,由人来制定万物的评价标准。人类存在的意义不是神授的,也不是外界赋予的,而是人类自己赋予自己的。不但如此,人还赋予宇宙存在的意义。机器能高效处理信息并避免人的主观性等特点使得机器应用范围扩大,同时使人类的存在意义受到质疑。数据改变人类生产生活,还使得人文主义面临挑战,“自由意志”和人的自由也受到威胁。数据主义将人类体验视同数据模式,破坏了人类的权威和意义来源。数据主义认为,人类不需要或者不可能从自身找到存在的价值和意义,只有数据才能赋予世界意义和价值,这种观点忽略了人的存在价值和意义,忽视了技术发展过程中的人性,这与人文主义的观点截然不同。哈贝马斯认为,科学是第一位的生产力,技术统治论是新型的意识形态,现在技术与科学已经取代了传统的神话和宗教。数据主义认为,数据技术既是技术判断,也是价值判断,数据主义把数据视作新的“宗教”是站在与人文主义对立的立场上。美国20世纪著名的哲学家刘易斯·芒福德认为,随着技术的发展,人类便开始把精力聚焦于工具和机器上,而不关注人性,人类用工具进步和机器变革作为人类文明发展的标志。例如,我们把蒸汽机作为工业革命的标志,但人不是“工具制造者”和“工具使用者”,而是“思想制造者”,发展技术应该关注人性和人类价值。哲学人类学家阿诺德·盖伦提出,“机器文明的一切机制都必须服从人的目的,人的需求”。在人文主义者看来,数据主义是对人文主义的背叛和逃离。对于人文主义者来讲,数据主义是一种科学主义或者技术主义,用数据来表征人类生存境况和人类命运,这是对技术发展的人文主义立场的背离。数据技术的发展也应该关注人性,关注人类的共同价值和命运。
[德]阿诺德·盖伦:《技术时代的人类心灵》(二)数据主义的理论预设错误数据主义的理论预设是数据可以解释世界、理解世界,数据主义既有利于我们解决世界的语义学问题,又可以解决世界的形而上学和认识论问题,数据技术优于人类能力。大数据的本体论性质决定着数据具有可重复性利用价值和共享性特点。大数据指的是数据大到需要超级计算机才能计算的数据集,这种海量数据的出现,不仅超出了普通人的理解和认知能力,而且超出人类的数据处理能力,特别是单个人的数据处理能力。计算机具有更强的数据处理能力,处理速度更快。弗洛里迪在《第四次革命——人工智能如何重塑人类现实》中提出,图灵革命是继哥白尼革命、达尔文革命、神经科学革命之后的第四次革命:哥白尼革命挑战了人的宇宙中心地位,达尔文革命挑战了人类的万物灵长地位,弗洛伊德的神经科学革命动摇了人的理性主体地位,而图灵革命挑战了人在信息处理中的优势地位。人类对数据本身越来越依赖,并且把它们作为社会繁荣的基础性资源。大数据专家拉泽等人认为,“大数据具有以前所未有的广度、深度和规模收集和分析数据的能力。”大数据数量大,非人类头脑所能处理,只有电子计算机或者云计算才能处理,计算机或者智能机器具有超强的数据分析能力,机器可以取代人类成为认识主体,这就削弱甚至剥夺了人的主体性地位。从这个意义来讲,坚持数据主义观点,就是坚持机器强于人的理论预设。宇宙万物也并不都能被数据化处理,例如,人类的审美无法被数据化,艺术的价值不能仅仅通过数据分析来体现。詹金斯提出,“艺术的价值,一出戏或者一幅画的质量是不可衡量的,你可以把各种数据输入机器:日期、颜色、图像、票房等,但不能解释艺术品是什么,它意味着什么以及它为什么如此强大,这需要人,而不是机器”,不要指望数据分析能解决所有问题,数据主义的理论预设“机器优于人类”是错误的。数据主义坚持的数据可以理解世界和解释世界的观点也未必是完全可靠的。数据并非客观可靠,进行数据挖掘和分析的人易受主观因素和偏见的干扰。“大数据作为一大堆原始信息,并不是不言自明的,然而,解释数据的具体方法是开放给各种哲学辩论的,数据是否代表'客观事实’或者所有解释是否必然会受到某些主观过滤或数据'清理’方法的偏见呢?”数据也可能是错误的,或存在偏差,数据集未必是随机的,可能受人为因素的影响,数据主义预设了数据技术可以理解世界、解释世界,其实它并非客观的,并不能解决世上所有问题,“机器优于人类”的理论预设是错误的。(三)数据主义之殇人类可以通过获得的数据来认识世界、分析世界、改造世界,但并不意味着数据没有风险,更不意味着数据获取和分析就一定是道德的。数据技术赋予人类力量,也束缚着人类的身体和意识空间,限制了人类作用的发挥,从而限制人类发展。例如数据鸿沟加大了不同国家、地区间的差异,导致不同国家和地区间发展机会的不公平;数据隐私泄露严重干扰人的工作和生活,威胁着人的生命和财产安全,等等。数据技术发展的隐忧,可能导致人的独立性和主体性地位的丧失,以及人对自由解放的美好生活目标的放弃。我们要正确认识数据、合理利用数据,避免数据主义的不良后果,对于数据主义可能造成的风险提前进行评估和预判。数据技术失控,并非技术问题,而取决于我们对技术的理解与责任,如果我们不能正确地认识数据主义,“数据即一切”的观点就犹如“潘多拉盒子”一样成为“灾难之源”,影响人类生存和发展。数据主义站在与人文主义对立的立场,坚持用数据理解、解释一切,缺少对人类命运的关切和人类境遇的担忧。我们在数据面前,应该保持人的独立性,提高人的自觉性,发挥人的能动性,确保人的主体性地位。“大数据涉及太多的认识论问题,也就是认识相关性问题,而现在更多的是我们应该怎样使用数据的道德问题;解决这些认识论问题需要技术性方法,即用更多更好的技巧与技术将大数据筛减到一个可控的规模。”如果任凭数据主义思潮泛滥,那么将影响到对数据的认识和应用,也影响到人类在自然界中的主体性地位。从远古时代至今,人类通过进化来适应自然,通过改变自己来适应社会。随着近代技术的发展,人类开始通过技术摆脱被自然奴役的命运。现在随着大数据技术和人工智能技术的发展,机器具有了高效的数据处理和分析能力,甚至具有智能,因此在数据技术与人工智能技术的发展过程中保证人的主体性地位愈发重要。在新兴技术应用之前,应该提前预判可能带来的灾难性后果,进行风险分析,正确评价和预估风险。同时,更要保障数据技术合乎道德的应用,避免数据技术应用可能带来的数据鸿沟、数据垄断、数据霸权等现象,在坚守人的主体地位、维护人的尊严的前提下,关注技术应用可能带来的社会隐忧和对人类社会的冲击,重新审视生命的意义,维护人类尊严,让数据造福人类,回归马克思主义哲学的逻辑起点,使人的世界即各种关系回归于人自身,促进人的自由全面发展,实现人类解放。综上所述,数据主义既引发我们思考形而上学与认识论问题,又引发我们思考语义学问题,前者关涉我们如何理解世界,后者关系到我们如何解释世界。数据主义远离了技术人文主义立场,其哲学理论渊源可以追溯到古希腊“万物皆数”的思想,为了规约数据技术的发展和应用,必须在使用中保持人的主体性地位,必须遵从人类的伦理规范,才能更好地发挥数据技术的作用,避免人的主体性地位的丧失,有利于早日实现人类的全面自由发展和彻底解放。作者单位:上海大学马克思主义学院
本刊已启用在线投稿系统,不再接受电子邮箱以及其他途径的投稿。作者可登录本刊官方投稿网站(http://mksz.cbpt.cnki.net),成功注册后登录系统进行投稿,并可以随时登陆系统跟踪查询稿件状态。投稿过程中如遇到问题,可随时与本刊取得联系。本刊原投稿邮箱mkszyyxs@126.com将作为编辑部联系邮箱使用。本刊不收取任何费用,包括版面费、审稿费及印刷费等。