微积分的未来:DNA、非线性、混沌、复杂系统与人工智能
导语
微积分是人类历史上的伟大思想成就之一,也是数学领域不可或缺的一个重要分支。如果没有微积分,人类就不可能发明电视、微波炉、移动电话、GPS、激光视力矫正手术、孕妇超声检查,也不可能发现冥王星、破解人类基因组、治疗艾滋病,以及弄明白如何把5000首歌曲装进口袋里。微积分对当今和未来的科技发展有怎样的影响?尤其是会怎样影响日益深入的各类复杂系统研究?著名数学家、小世界网络模型提出者史蒂夫·斯托加茨,在他的新书《微积分的力量》中,梳理了微积分发展的历史脉络,并展望了微积分方法与非线性动力学在多个交叉领域的应用前景。本文摘自《微积分的力量》第11章《微积分的未来》。
史蒂夫·斯托加茨 | 作者
目录(本篇)
微积分的未来
本章的标题(微积分的未来)可能会让那些认为微积分是明日黄花的人感到惊讶。它怎么会有未来呢?它现在已经结束了,不是吗?在数学圈,你常会吃惊地听到类似的话。根据这种说法,得益于牛顿和莱布尼茨取得的突破,微积分轰轰烈烈地开始发展。他们的发现在18世纪激发了人们淘金热般的心态,有趣且近乎疯狂的探索活动成为这一时期的标志性特征,无穷这个“石巨人”也像脱缰的野马般肆意狂奔。数学家由此收获了惊人的成果,但谬论和混乱也随之而来。所以,19世纪的那几代数学家表现得更加严谨。他们把“石巨人”赶回了笼中,消除了微积分中的无穷大和无穷小,巩固了这个学科的基础,最终阐明了极限、导数、积分和实数的真正含义。到20世纪前后,他们的清理工作画上了句号。
在我看来,这种关于微积分的看法太狭隘了。微积分不只是牛顿、莱布尼茨及其继任者的研究成果,它开始的时间还要早得多,如今依然在壮大。对我来说,微积分可以由它的信条来定义:在解决关于任意连续体的难题时,先把它切分成无穷多个部分,然后一一求解,最后通过把各个部分的答案组合起来去解决原始的难题。我把这个信条称作无穷原则。
无穷原则从一开始就存在:它在阿基米德关于曲线形状的著作中,它在科学革命中,它在牛顿的世界体系中,如今它在我们的家中、工作中和汽车里。它让GPS、手机、激光和微波炉的发明成为可能。美国联邦调查局用它压缩了数百万份指纹文件,阿兰·科马克用它创建了CT 扫描理论,他们都通过重组简单部分(子波之于指纹文件,正弦波之于CT 理论)的方法解决了难题。从这个角度看,微积分是用于研究任何事物——任何模式,任何曲线,任何运动,任何自然过程、系统或现象——的想法与方法的庞杂集合,这些事物的变化平稳而连续,符合无穷原则。该定义的范畴远远超出了牛顿和莱布尼茨的微积分,并囊括了它的子孙后代:多变量微积分,常微分方程,偏微分方程,傅里叶分析,复分析,以及高等数学中涉及极限、导数和积分的所有其他分支。由此可见,微积分还没有完结,它和以前一样求知若渴。
但我属于少数派,实际上,只有我一个人持这种观点。我数学系的同事并不认为上述一切都是微积分,他们的理由很充分:这太荒谬了。课程体系中有一半的课不得不重新命名,除了微积分1、微积分2和微积分3以外,还有微积分4直到微积分38,让人不明所以。于是,我们给微积分的每个分支都取了不同的名字,并模糊了它们之间的连续性。我们把微积分切分成可供使用的最小部分,这种做法虽然有些讽刺,但或许很恰当,因为微积分本身的信条就是把连续的事物切分成多个部分,使它们变得更易于理解。需要明确的一点是,我并不反对所有不同的课程名称。我想说的是,这种切分可能会误导我们,让我们忘记那些课程本就是微积分的一部分。我写作本书的目标是,将微积分作为一个整体呈现在你们面前,让你们感受它的美、统一和壮观。
那么,微积分会拥有什么样的未来呢?就像人们说的那样,预测总是很难,尤其是对未来的预测。但我认为,我们可以大胆地假设,未来几年围绕微积分可能有几个重要趋势,包括:
· 微积分在社会科学、音乐、艺术和人文领域的新应用;
· 微积分在医学和生物学领域的持续应用;
· 应对金融、经济和天气固有的随机性;
· 微积分为大数据服务,反之亦然;
· 非线性、混沌和复杂系统的持续挑战;
· 微积分与计算机(包括人工智能)之间不断演化的合作关系;
· 将微积分推广至量子领域。
我们需要探讨的内容有很多,与其对这里提到的每个主题都说上几句,不如专注于其中几个问题。在简要地介绍DNA(脱氧核糖核酸)的微分几何(曲线之谜与生命的奥秘在此相遇)之后,我们将研究一些能让你获得哲学启发的案例,其中包括混沌、复杂性理论,以及计算机和人工智能的崛起带来的洞察力及预测方面的挑战。然而,为了弄明白这些案例,我们需要回顾一下非线性动力学的基本原理,这有助于我们更好地理解接下来将要面临的挑战。
DNA的缠绕数
传统上,微积分一直应用于像物理学、天文学和化学这样的“硬” 科学。但近几十年来,它进入了生物学和医学领域,在流行病学、种群生物学、神经科学和医学成像等方面发挥着作用。在本书中,我们已经看到了不少数学生物学的例子,比如,利用微积分预测面部手术的结果,为HIV 与免疫系统的战斗过程建模,等等。但所有这些例子都与变化之谜(关于微积分的最新困扰)的某个方面有关。相比之下,下面这个例子来自古老的曲线之谜,一个关于DNA 的三维路径的谜题为它赋予了新的生命。
这个谜题与DNA在细胞中的“打包”方式有关,DNA是一种超长分子,包含了一个人成长发育所需的全部遗传信息。在你的大约10万亿个细胞中,每个都含有约2米长的DNA。如果将它们首尾相连,那么DNA可以在地球和太阳之间往返几十次。不过,怀疑论者可能会辩称,这种比较并不像听上去那么令人印象深刻,它只是反映了我们每个人都有很多细胞。而与DNA所在细胞的细胞核比大小,或许更能说明问题。一个典型的细胞核的直径约为5 微米,它是细胞内DNA 长度的40万分之一, 这个压缩系数相当于把20 英里长的绳子塞到一个网球里。
此外,DNA也不能被随意地塞入细胞核。它绝对不能缠绕在一起, 而必须以有序的方式打包,这样DNA才能被酶读取,并被翻译成细胞维持生命活动所需的蛋白质。有序的打包方式还有一个重要作用,那就是当细胞分裂时DNA可以被整齐地复制。
进化用线轴解决了打包问题,当我们需要存放一根很长的线时也会采取相同的方法。细胞中的DNA缠绕在分子线轴上,这些线轴由一种叫作组蛋白的特殊蛋白质组成。为了实现进一步压缩,线轴会像项链上的珠子一样首尾相连,然后这条“项链”会盘绕成绳索状纤维,这些纤维本身又会盘绕成染色体。最终,通过重重盘绕,DNA被压缩成足以放入狭窄细胞核的大小。
但线轴并不是大自然解决打包问题的原始解决方案。地球上最早的生物是没有细胞核和染色体的单细胞生物,就像今天的细菌和病毒一样,它们也没有线轴。在这种情况下,遗传物质是通过一种基于几何学和弹性的机制来压缩的。想象一下,你拉紧一条橡皮筋,用手指夹住它的一端,并从另一端扭转它。刚开始,橡皮筋的每次转动都会产生一个扭结。扭结不断增加,当累积的扭转超过临界值时,橡皮筋不再保持绷直状态,而会突然弯曲并盘绕在自己身上,仿佛在痛苦地扭动。最终,橡皮筋聚成一团,实现了压缩。DNA也是这样做的。
这种现象被称为超螺旋化,它普遍存在于DNA的环状结构中。尽管我们倾向于把DNA描绘成两端开放的直螺旋,但在许多情况下,它会自我闭合成一个环。当这种现象发生时,就好比解开你的安全带,把它扭曲几圈再扣上一样。此后安全带的扭曲次数就不变了——它被锁定了。在不解开安全带的前提下,如果你试图在某一处扭曲它,其他地方就会形成反向扭曲来抵消这种操作。其中,有某个守恒定律在起作用。
当你把花园用的软管盘绕成好几圈堆在地上时,也会发生同样的事情。而当你试图把软管直直地拉出来时,它会在你的手里扭曲。就这样,盘绕转变成扭曲。这种转换也可以反向进行,即从扭曲变为缠绕,就像橡皮筋在扭曲时发生了缠绕一样。原始生物的DNA正是利用了这种缠绕作用, 某些酶可以切割DNA,扭曲它,再把它闭合起来。当DNA 为了降低其能量而放松扭曲时,守恒定律就会迫使它的超螺旋化程度增强,让它变得更紧凑。这样一来,DNA分子的最终路径不再位于一个平面内,而是在三维空间中缠绕。
20世纪70年代初,美国数学家布洛克·富勒率先做出了关于DNA的三维缠绕现象的数学描述。他发明了一个叫作DNA缠绕数的量,用积分和导数推导出它的公式,证明了关于它的某些定理,从而明确了针对螺旋和缠绕的守恒定律。此后,关于DNA的几何学和拓扑学研究成为一个蓬勃发展的产业。数学家已经利用纽结理论和缠结微积分 阐明了某些酶的作用机制,这些酶可以扭曲或切割DNA,或者将结与链引入DNA。由于这些酶改变了DNA的拓扑结构,因此被称为拓扑异构酶。它们可以弄断和再连接DNA 链,对细胞的分裂和生长起到至关重要的作用。经证实,它们是癌症化学治疗药物的有效靶点。尽管其作用机制尚不清楚,但人们认为,这些药物(被称为拓扑异构酶抑制剂)通过阻断拓扑异构酶的作用,可以选择性地损坏癌细胞的DNA,导致癌细胞自杀。这对患者来说是好消息,对肿瘤来说则是坏消息。
在将微积分应用于超螺旋DNA时,双螺旋被建模为一条连续曲线。微积分一如既往地喜欢处理连续对象,但事实上,DNA是一群离散的原子,它没有什么地方是真正连续的。但是,为了得到好的逼近,DNA可被看作像理想的橡皮筋一样的连续曲线。这样做的好处是,微积分的两个副产品——弹性理论和微分几何学——可用于计算当DNA受到来自蛋白质、环境及与自身相互作用的力时,它会如何变形。
更重要的一点是,微积分延续了它一贯的创造性,将离散对象当作连续体来处理,从而揭示它们的行为。这种模拟尽管是近似的,但却很有用。无论如何,这都是我们唯一的选择。没有连续性假设,就无法使用无穷原则。没有无穷原则,就不会有微积分,也不会有微分几何和弹性理论。
我希望,未来我们将看到更多将微积分和连续数学应用于天生离散的生物学“角色”的例子,比如基因、细胞、蛋白质和生物学“大戏” 中的其他“演员”。我们能从连续体近似方法中获取的洞见实在太多了, 以至于不能不用它。除非我们开发出一种新的微积分形式,它可以像传统微积分适用于连续系统那样适用于离散系统,否则无穷原则将在生物的数学建模方面继续指导我们。
决定论及其局限性
接下来我们要谈论的两个话题是:非线性动力学的兴起和计算机对微积分的影响。我之所以选择这两个问题,是因为它们的哲学内涵十分有趣。它们可能会永远地改变预测的本质,并开启微积分(更一般地说是科学)的新时代,到那个时候,人类的洞察力或许会开始衰退,但科学本身仍将继续前行。为了阐明我的这句有些许末日警告意味的话是什么意思,我们需要理解预测到底为什么可行,它的经典含义是什么,以及我们的经典观念在过去几十年里,是如何被非线性、混沌和复杂系统研究所取得的发现修正的。
19世纪早期,法国数学家和天文学家皮埃尔– 西蒙·拉普拉斯把牛顿的机械宇宙决定论推至它的逻辑极限。拉普拉斯设想了一个全知全能的智慧生物——拉普拉斯妖,它可以追踪宇宙中所有原子的所有位置, 还有作用于它们的所有力。“如果这个智慧生物也能对这些数据进行分析,”他写道,“那就没有什么是不确定的了,未来也会像过去一样呈现在它眼前。”
随着20世纪的临近,这种对机械宇宙的极端表述在科学和哲学上似乎都开始站不住脚了。其中一个原因来自微积分,为此我们要感谢索菲·柯瓦列夫斯卡娅。柯瓦列夫斯卡娅出生于1850年,在莫斯科的一个贵族家庭长大。11岁时她发现自己被微积分包围了,她卧室的一面墙上贴满了她父亲年少时记下的微积分课程笔记。柯瓦列夫斯卡娅后来写道, 她“在那面神秘的墙旁度过了童年时光,尝试通过理解其中的每一句话,找出页与页之间的正确顺序”。后来,她成为历史上第一位获得数学博士学位的女性。
尽管柯瓦列夫斯卡娅很早就表现出数学方面的天赋,但俄罗斯的法律不准许她上大学。她选择了一段形式婚姻,尽管这在随后的几年里令她心痛,但至少允准她去德国,她卓越的天分给那里的几位教授留下了深刻印象。然而,即使在德国,柯瓦列夫斯卡娅也无法光明正大地去上课,只能私下跟着分析家卡尔·魏尔斯特拉斯学习。在魏尔斯特拉斯的推荐下,柯瓦列夫斯卡娅因为解决了分析学、动力学和偏微分方程方面的几个突出问题而被授予博士学位。她最终成为斯德哥尔摩大学的一名教授,执教8 年后死于流感,终年41岁。2009年,诺贝尔文学奖得主艾丽丝·门罗发表了一篇关于柯瓦列夫斯卡娅的短篇小说《幸福过了头》。
柯瓦列夫斯卡娅的关于决定论局限性的见解,源于她对刚体动力学的研究。刚体是针对不能弯曲或变形的物体的一种数学抽象,它的所有点都刚性地连接在一起。陀螺就是一种刚体,它非常坚固,由无穷多个点组成,所以陀螺是比牛顿研究的单点状粒子更复杂的机械对象。在天文学和空间科学中,刚体的运动对于描述从土卫七(土星的一个土豆状的小卫星)的混沌翻滚到太空舱或卫星的规律旋转等现象都具有重要意义。在研究刚体动力学时,柯瓦列夫斯卡娅得出了两个重要结果。一个重要的结果是,她全面分析和解决了陀螺的运动问题,这与牛顿解决二体问题具有同等重要的意义。尽管另外两个这样的“可积陀螺”早已为人所知,但她研究的这个更加精妙和令人吃惊。
另一个重要的结果是,她证明了不可能存在其他可解陀螺。她发现的正是最后一个,而余下的陀螺都是不可解的,这意味着它们的动力学问题也不可能用牛顿式公式来解决。这不是一个智力不足的问题,而只是证明了根本没有能描述所有陀螺运动的特定类型的公式(时间的亚纯函数)。就这样,她限定了微积分的适用范围。一个陀螺即可挑战拉普拉斯妖,从原则上说,找到关于宇宙命运的公式也无望了。
非线性
索菲·柯瓦列夫斯卡娅发现的不可解性与陀螺方程的一个结构特性有关,即该方程是非线性的。我们在这里无须关注非线性的技术意义,就目的而言,我们只需要感受线性系统与非线性系统之间的区别,这一点通过思考日常生活中的一些例子即可实现。
为了说明线性系统是什么样子,我们假设有两个人纯粹出于玩乐的目的,同时上秤称他们的体重。两个人的总重量是他们各自的体重之和,这是因为秤是一种线性装置。他们的体重既不会相互影响,也不会导致任何需要注意的棘手情况。比如,他们的身体不会以某种方式互相串通, 使总重量变轻,或者互相妨碍,使总重量变重。所以,它们只是相加。在像秤这样的线性系统中,整体等于部分之和,这是线性的第一个关键特性。线性的第二个特性是,原因与结果成正比。想象一下弓箭手拉弓弦的情景。如果把弓弦向后拉一定的距离需要花一定大小的力,那么将弓弦向后拉两倍的距离就需要花两倍大小的力。所以,原因和结果成正比。这两个特性(整体等于部分之和,原因和结果成正比)就是线性含义的本质。
然而,自然界中的许多事情都比拉弓弦复杂得多。当系统的各个部分互相干扰、合作或竞争时,就会发生非线性的相互作用。大部分日常活动显然都是非线性的,如果同时听你最喜欢的两首歌,你不会得到双倍的快乐。如果同时喝酒和吸毒,两者相互作用甚至会产生致命的结果。相比之下,花生酱和果冻搭配起来吃效果更佳,它们不是简单地相加,而是协同增效。
非线性让世界变得丰富多彩、美妙而复杂,还常常是不可预测的。比如,生物学的方方面面都是非线性的,社会学亦如此。这就是软科学很难也是最后才被数学化的原因。由于非线性的特性,它们一点儿也不“柔软”。
线性和非线性之间的区别同样适用于微分方程,但没有那么直观。需要说明的一点是,如果微分方程是非线性的,就像柯瓦列夫斯卡娅的陀螺那样,分析起来就会极其困难。从牛顿开始,数学家都尽可能地避免使用非线性微分方程,因为在他们看来,这类方程既令人不悦,又难以掌控。
相反,线性微分方程既令人愉悦,又容易驯服。数学家喜欢它们,就是因为它们简单。所以,解决这类方程的相关理论有很多。实际上, 直到20世纪80年代前后,应用数学家受到的传统教育几乎完全集中在线性方法的运用上,其中有好几年都在学习傅里叶级数和其他求解线性方程的技巧。
线性的一大优势在于,它为还原论思维的运用创造了条件。要解决一个线性问题,我们可以先把它分解成几个最简单的部分,再分别求解每个部分,最后把它们组合起来得到答案。傅里叶正是利用这种还原论策略解出了他的热传导(线性)方程。他先把复杂的温度分布分解成多个正弦波,再算出所有正弦波各自的变化,最后将这些正弦波重新组合起来, 去预测加热金属棒的整体温度变化情况。这个策略之所以可行,就是因为热传导方程是线性的,它可以在不失去其本质的情况下被切分成小段。
索菲·柯瓦列夫斯卡娅让我们认识到,当我们最终勇敢地面对非线性时,这个世界看上去会有多么不同。她意识到,非线性能限制人类的狂妄自大。如果一个系统是非线性的,它的行为就不可能用公式来预测,即使该行为是完全确定的。换句话说,决定论并不意味着可预测性。虽然陀螺只是一种小孩子的玩意,但它的运动能让我们在求知时怀有一颗谦逊之心。
混沌
现在回想起来,我们就能更清楚地知道为什么牛顿在尝试解决三体问题时会头疼了。三体问题和二体问题不同,前者无疑是非线性的,而后者可以被改造成线性的。非线性并不是由二体骤变为三体导致的,而是由方程本身的结构引发的。对两个而非三个或更多的引力体来说,非线性可以通过在微分方程中恰当地选择新变量来消除。
人们花了很长时间才充分认识到非线性有让人变得谦逊的作用。数学家为解决三体问题苦苦挣扎了几个世纪,尽管取得了些许进展,却没有人能彻底破解它。19世纪末,法国数学家亨利·庞加莱自认为解决了这个问题,但他犯了一个错误。在修正了错误之后,尽管仍然无法解决三体问题,但他发现了更重要的现象,我们现在称之为混沌。
混沌系统是非常讲究细节的,即使是开始方式的小小改变,也会产生大不相同的结果,这是因为初始条件的小变化会以指数方式放大。任何微小的误差或扰动都会像滚雪球一样迅速增大,以至于从长远看,这个系统会变得不可预测。混沌系统不是随机的,而是确定的,因此短期来看它们是可预测的。但长期来看,它们对微小的扰动十分敏感,以至于在许多方面实际上都是随机的。
混沌系统在某个时间之前是完全可以预测的,这个时间被称为可预测性时界。在此之前,系统的确定性使其具有可预测性。根据计算,整个太阳系的可预测性时界约为400万年。对于比这短得多的时间,比如地球绕太阳一周所需的时间(一年),一切都会像时钟一样有规律地运转。然而,一旦过了几百万年,一切就会变得无法预测。太阳系中所有天体之间微妙的引力摄动不断累积,直至我们再也无法准确地预测这个系统的行为。
庞加莱在研究过程中发现了可预测性时界的存在。在他之前,人们认为误差只会随着时间呈线性增长,而非指数增长;如果时间翻倍,误差也会翻倍。随着误差的线性增长,改进测量方法总能满足人们做出长期预测的需求。但是,当误差以指数方式迅速增长时,系统对其初始条件就会产生敏感依赖性,长期预测也会变得不再可行。这就是混沌系统在哲学上令人不安的地方。
理解混沌系统的上述特性至关重要。一直以来人们都知道像天气这样的大型复杂系统是很难预测的,但令人惊讶的是,像陀螺或三体这样的简单事物同样不可预测。这对天真地想把决定论与可预测性合并起来的拉普拉斯来说,是又一次打击。
从积极的方面看,混沌系统中之所以存在秩序的痕迹,是因为它们的确定性特征。庞加莱开发出分析非线性系统(包括混沌系统)的新方法,并找到了提取出隐藏其中的某些秩序的方法。他使用的是图像和几何学,而不是公式和代数;他的定性方法为拓扑学和动力系统等现代数学领域播下了种子。得益于他的开创性研究,我们现在对秩序和混沌都有了更好的理解。
庞加莱图
我们不妨以伽利略研究过的钟摆摆动问题为例,说明庞加莱的方法是如何发挥作用的。利用牛顿运动定律并关注钟摆摆动时受到的力,我们可以画出一幅展示钟摆每时每刻的角度和速度变化情况的抽象示意图。这幅图基本上是对牛顿定律的一种视觉化翻译,除了微分方程中的已有要素外,图中没有任何其他新内容。简言之,它只是查看相同信息的另一种方式。
这幅图好像一幅展示乡村天气模式的示意图。在这样的图上,我们会看到示局部传播方向,也就是天气锋面每时每刻的移动方式的箭头。这和微分方程提供的信息一样,和舞蹈指令给出的信息(比如,左脚放在这里,右脚放在那里)也一样。这样的图被称为矢量场图,上面的小箭头是矢量,表明如果单摆的角度和速度是现在这种情况,那么它们在片刻之后应该会变成什么样子。钟摆的矢量场图如图11–1 所示:
原书图11–1 钟摆的矢量场图
在我们解释这幅图之前,请记住它是抽象的,因为它并没有展示出钟摆的实际形象。旋涡状的箭头图样不像一个挂在绳子上的重物,钟摆的照片可不是这样的。(矢量场图下方有钟摆摆动的草图,你可以从中体会这句话的意思。)矢量场图并不是对钟摆的现实描绘,而是展示钟摆状态从一个时刻到下一个时刻的变化情况的抽象图示。图上的每个点都代表钟摆的角度与速度在某个瞬间的可能组合,横轴代表钟摆的角度,纵轴代表它的速度。在任意时刻,如果知道了角度和速度,我们就可以定义钟摆的动态。当我们预测钟摆在下一时刻和此后各个时刻的角度和速度时,箭头可以提供我们所需的信息,我们要做的就只是跟着它们走。
箭头在中心附近的旋涡状排列方式,对应着几乎垂直向下的钟摆的简单往复运动;而顶部和底部箭头的波浪状排列方式,则对应着钟摆像螺旋桨一样有力地转过最高点的运动。牛顿和伽利略从未考虑过这种涡旋状运动,它们已经超出了经典方法的计算范围。然而,我们在庞加莱图中可以清楚地看到涡旋状运动。现在,这种研究微分方程的定性方法是非线性动力学的所有相关领域——从激光物理学到神经科学——的一个重要组成部分。
走上战场的非线性
非线性动力学非常实用。在英国数学家玛丽·卡特赖特和约翰·李特尔伍德的努力下,庞加莱的方法为英国在战时对抗纳粹的空袭做出了贡献1938年,英国科学与工业研究部恳请伦敦数学学会帮助解决一个问题,该问题与英国政府秘密研发的无线电探测和测距(现在叫作“雷达”)技术有关。项目工程师对在放大器中观测到的嘈杂和不规则的振动现象备感困惑,当这些装置由高功率的高频无线电波驱动时,这种现象表现得尤为明显。他们担心可能是设备出了问题。
政府的求助引起了卡特赖特的注意,她一直在研究由类似的“看起来令人厌恶的微分方程”支配的振动系统模型。她和李特尔伍德后来发现了雷达电子设备中不规则振动的来源:放大器是非线性的,如果被驱动得太快和太厉害,它们就会产生不规则的反应。
几十年后,物理学家弗里曼·戴森追忆了1942年他聆听卡特赖特演讲时的情形。他写道:
在第二次世界大战期间,雷达的全面发展依赖于高功率的放大器,所以拥有有效的放大器成为一件生死攸关的事情。士兵们饱受失效放大器的折磨,并为此谴责制造商的无良行为。然而,卡特赖特和李特尔伍德发现,该受责备的不是制造商,而是方程本身。
卡特赖特和李特尔伍德的洞见促使雷达工程师在放大器的行为更具可预测性的情况下操作它们,从而解决了这个问题。尽管做出了重要贡献,但卡特赖特一直表现得很谦逊。当读到戴森撰写的关于她的研究成果的文章时,她还责备他言过其实。
玛丽·卡特赖特女爵士于1998年去世,享年97岁。她是第一位入选英国皇家学会的女性数学家。她留下了严格的指示,绝对不要在她的追悼会上致颂词。
微积分与计算机联盟
战时求解微分方程的需要,推动了计算机的发展。当时被称为机械电子大脑的计算机,通过考虑空气阻力和风向等复杂情况,可以计算出现实条件下火箭和炮弹的飞行轨迹。战场上的炮兵军官需要利用这些信息去命中目标,所有必需的弹道数据都要提前算出来,并编制成标准的表格和图表。因此,高速计算机对完成这项任务而言至关重要。在数学模拟中,计算机利用恰当的微分方程和一个个小增量来更新炮弹的位置和速度,然后通过海量的加法运算(蛮力算法)得出答案,从而使一枚理想的炮弹沿它的飞行轨迹小步前进。只有机器才能不停歇地运转,并且快速、准确和不知疲倦地执行所有必要的加法和乘法运算。
从一些最早期计算机的名称中,我们可以明显地看出微积分在这项工作中的贡献。其中一种是名为微分分析仪的机械装置,它的工作是求解用于计算火炮射表的微分方程。另一种名为电子数字积分计算机(ENIAC),它建造于1945 年,是第一批可重复编程的通用计算机之一。除了计算火炮射表以外,它也能用于评估氢弹的技术可行性。
尽管微积分和非线性动力学的军事应用促进了计算机的发展,但在和平时期,计算机在数学和机器方面同样大有可为。20世纪50年代,科学家开始使用计算机去解决他们各自学科(除物理学以外)中出现的问题。比如,英国生物学家艾伦·霍奇金和安德鲁·赫胥黎需要在计算机的帮助下理解神经细胞是如何相互交流的,更具体地说,就是电信号如何沿神经纤维传导。他们进行了艰苦细致的实验,计算钠离子和钾离子流经一种很大且便于实验的神经纤维(鱿鱼的巨大轴突)膜的情况,并根据经验推断出这些离子流如何受到膜电位的影响,而膜电位又如何被离子流改变。但如果没有计算机,他们就无法计算神经脉冲沿轴突传导时的速度和形状。想计算神经脉冲的动态,就要求解一个膜电位作为时间和空间函数的非线性偏微分方程。安德鲁·赫胥黎花了三周时间,终于在一台手摇机械计算器上解决了这个问题。
霍奇金(1914-1998)和赫胥黎(1917-2012)由于发现神经细胞膜的单离子通道而获得1963年诺贝尔生理学或医学奖
1963年,霍奇金和赫胥黎因为发现了神经细胞工作原理的离子基础,共同获得了诺贝尔生理学或医学奖。对所有有意将数学应用于生物学领域的人来说,他们的方法都是一个很大的启发。这无疑扩展了微积分的应用领域,数学生物学是对非线性微分方程的一次不受限的运用。在牛顿式分析方法和庞加莱式几何方法的帮助下,以及对计算机的泰然自若的依赖下,数学生物学家正在寻找支配心律、传染病传播、免疫系统运转、基因编辑、癌症发展和其他许多生命奥秘的微分方程,并取得了一定的进展。而如果没有微积分,他们可能根本做不到。
复杂系统与高维诅咒
庞加莱方法最严重的局限性与无法想象三维以上空间的人类大脑有关。自然选择使我们的神经系统能够感知普通空间的三个方向,即上下、前后和左右。但不管怎么努力,我们都无法想象出第四个维度,或者说无法在脑海中“看见”它。然而,有了抽象符号,我们就可以尝试处理任意数量的维度。费马和笛卡儿向我们展示了相关做法,他们的xy 平面使我们了解到数字可以依附于维度。左右对应于数字x,上下对应于数字y;通过涵盖更多的数字,我们还可以涵盖更多的维度。对三维空间来说,x、y 和z 就足够了。为什么不能有四维或者五维空间呢?还剩下很多字母呢。
你可能听说过,时间是第四个维度。的确,在爱因斯坦的狭义相对论和广义相对论中,空间和时间被融合成单一的实体——时空,并被表示成一个四维的数学领域。粗略地说,普通空间被绘制在前三个轴上, 时间被绘制在第四个轴上。这种结构可被看作对费马和笛卡儿的二维xy 平面的拓展。
然而,我们在这里要讨论的不是时空。庞加莱方法的固有局限性涉及一个更加抽象的领域,它是对我们在研究钟摆的矢量场时遇到的抽象状态空间的拓展。在那个例子中,我们构建了一个抽象空间,其中的一个轴代表钟摆的角度,另一个轴代表钟摆的速度。在每个时刻,钟摆的角度和速度都有特定的值。因此,在那个时刻,它们对应于角– 速度平面上的一个点。这个平面上的箭头(看似舞蹈指令的那些箭头)就像钟摆的牛顿微分方程那样,决定了每时每刻的状态变化情况。循着箭头,我们就可以预测出钟摆将如何移动。钟摆有可能来回摆动,也有可能转过最高点,这取决于它的起点位置。所有信息都包含在这幅矢量场图中。
重要的是,我们要意识到,钟摆的状态空间之所以是二维的,是因为它的角度和速度对预测它的未来状态而言是充要条件。这两个变量给了我们预测钟摆下一刻、再下一刻直到未来的角度与速度所需的全部信息,从这个意义上说,钟摆是一个天生的二维系统,它有一个二维状态空间。
当我们考虑比钟摆更复杂的系统时,高维诅咒就会出现。比如,我们来看看让牛顿头疼的三体问题。它的状态空间有18个维度,为了弄清楚原因,我们把注意力集中在其中一个引力体上。在任何时刻,该引力体都位于普通三维物理空间中的某个地方。因此,它的位置可以由3个数字x、y、z 指定。它也可以沿这3个方向中的任意一个移动,从而对应于3个速度。简言之,一个引力体需要具备6条信息:表示它所在位置的3个坐标,以及它在3个方向上的速度。这6个数字指定了它的位置和运动方式,让它们分别和这个问题中的3个引力体相乘,就可以得到状态空间中的6×3=18个维度。因此,在庞加莱的方法中,系统(由3个引力体组成)的不断变化的状态,可以用一个在18维空间中四处移动的抽象点来表示。随着时间的推移,这个抽象点会描绘出一条轨迹——类似于真正的彗星或者炮弹的运动轨迹——只不过这条抽象的轨迹存在于庞加莱的幻想世界(三体问题的18维状态空间)中。
当我们将非线性动力学应用于生物学领域时,常常发现有必要想象更高维度的空间。比如,在神经科学中,我们需要追踪霍奇金和赫胥黎的神经膜方程涉及的所有钠、钾、钙、氯和其他离子浓度的变化。这些方程的现代版本可能涉及数百个变量,它们代表了神经细胞中离子浓度的变化、膜电位的变化,以及细胞膜传导各种离子并允许它们进出细胞能力的变化。在这种情况下,抽象状态空间有数百个维度,每个维度都对应一个变量:第一个对应钾离子浓度,第二个对应钠离子浓度,第三个对应膜电位,第四个对应钠电导,第五个对应钾电导,等等。在任何时刻,所有这些变量都会取一定的值。霍奇金– 赫胥黎方程(及其推广形式)向这些变量发出了舞蹈指令,告诉它们如何沿轨迹运动。这样一来,利用计算机描绘状态空间中的轨迹,就可以预测出神经细胞、脑细胞和心脏细胞的动态,其准确度有时甚至会高得惊人。人们正在利用这种方法取得的成果进行神经病理学和心律失常方面的研究,旨在设计出更好的除颤器。
如今,数学家常常思考任意维数的抽象空间,即n维空间,而且我们已经开发出任意维数的几何学和微积分。正如我们在第10章看到的那样,CT 扫描背后理论的发明者阿兰·科马克纯粹是出于好奇心,他想知道CT 在四维空间中会如何运行。伟大的成果往往来自这种纯粹的冒险精神。当爱因斯坦需要适用于广义相对论的弯曲时空的四维几何时,他欣喜地得知它已然存在。这要归功于波恩哈德·黎曼,他在几十年前出于最纯粹的数学原因创建了四维几何。
因此,追随自己对数学的好奇心,可以给我们带来无法预见的科学回报和实际回报。它本身也给数学家带来了极大的乐趣,并且揭示了不同数学分支之间的隐秘联系。出于这些原因,在过去200年里,对高维空间的探索一直是一个活跃的数学分支。
然而,尽管我们有一个可在高维空间中做数学运算的抽象系统,但数学家仍然很难让这些空间可视化。事实上,更坦白地讲,我们无法让它们可视化。我们的大脑根本做不到,我们也不具备那样的能力。
T-Sne是一种常用的高维数据可视化方法
这种认知局限性对庞加莱的计划造成了严重打击,至少在3个以上维度的空间中如此。他的非线性动力学研究方法依赖于视觉上的直观感受,如果我们无法想象在4维、18维或者100维空间中会发生什么,他的方法就不能为我们提供太多帮助。这已经成为复杂系统领域进步的一大障碍,如果我们想搞清楚一个健康的活细胞中发生的数千种生化反应,或者解释它们如何出错进而引发癌症,就必须理解高维空间。如果我们想利用微分方程理解细胞生物学,就得用公式解开这些方程(索菲·柯瓦列夫斯卡娅证明我们做不到)或者想象出它们的样子(我们有限的大脑也做不到)。
因此,关于复杂的非线性系统的数学研究令人沮丧。不管是经济、社会和细胞的行为,还是免疫系统、基因、大脑和意识的运转,对任何想在我们时代的这些最棘手问题上取得进展的人来说,即使不是完全不可能,似乎也总是很困难。
一个更大的难题是,我们甚至不知道其中一些系统是否包含类似于开普勒和伽利略发现的那些模式。神经细胞显然有,但经济或者社会呢?在许多领域,人类的理解仍然处于前伽利略或者前开普勒阶段。我们尚未找到模式,那么我们如何才能找到洞见这些模式的更深层次的理论呢?生物学、心理学和经济学都不是牛顿式的,它们甚至也不是伽利略式和开普勒式的。所以,我们还有很长的路要走。
计算机、人工智能和洞察力之谜
在这一点上,计算机必胜主义者有话要说。他们认为,有了计算机,有了人工智能,所有这些问题都将迎刃而解。而且,这很有可能是真的。长期以来,计算机一直在帮助我们研究微分方程、非线性动力学和复杂系统。当霍奇金和赫胥黎在20世纪50年代打开了理解神经细胞工作原理的大门时,他们在一台手摇机器上解出了他们的偏微分方程。当波音公司的工程师在2011年设计787梦想客机时,他们利用超级计算机计算飞机受到的升力和阻力,从而找出防止机翼发生颤振的方法。
尽管计算机刚开始只是作为计算机器,但它们现在的功能远不只是计算,并且已经获得了某种人工智能。比如,谷歌翻译如今在地道翻译方面表现出色,有的医学人工智能系统诊断疾病的准确度比最优秀的人类专家还高。
但我认为,没有人会说谷歌翻译了解语言的真谛,或者医学人工智能系统理解疾病的原理。计算机有可能变得富有洞察力吗?如果答案是肯定的,那么它们能和我们分享有关我们真正关心的事情——比如复杂系统(大多数重大的未解科学问题的核心)——的见解吗?
为了探究支持或反对计算机具有洞察力这种可能性的理由,我们来看看计算机国际象棋是如何逐步发展的。1997年,IBM(国际商业机器公司)的国际象棋博弈程序“深蓝”,在一场6局的比赛中击败了国际象棋世界冠军加里·卡斯帕罗夫。尽管这个结果在当时出人意料,但这一成就并没有什么神秘之处。这台机器每秒钟可以评估2亿种棋局,虽然它没有洞察力,但它有惊人的速度,而且从不知疲倦,从不会在计算中出错,也从不会忘记一分钟前它在想什么。尽管如此,从机械和物质方面看,它的表现仍然像一台计算机。它可以凭借计算击败卡斯帕罗夫,却无法靠智慧取胜。当今世界上最强大的国际象棋程序虽然有令人生畏的名字,比如“鳕鱼”和“科莫多巨蜥”,但它们仍然以异于人类的方式下棋。它们喜欢吃掉对方的棋子,并进行钢铁般的防守。虽然它们比所有人类棋手都强大得多,但它们没有创造力或洞察力。
然而,随着机器学习的兴起,一切都变了。2017年12月5日,谷歌旗下的深度思维公司发布了一款名为“阿尔法零”的深度学习程序,震惊世界棋坛。通过与自己对弈数百万次并从错误中吸取教训,这个程序自学了国际象棋。在短短的几小时之内,它就变成了历史上的最佳棋手。它不仅能轻易击败所有最优秀的人类象棋大师(它甚至懒得去试),还击败了当时的计算机国际象棋世界冠军。在与强大的“鳕鱼”程序进行的一场100局的比赛中,“阿尔法零”取得了28胜72平的战绩,一局未输。
最可怕的一点是,“阿尔法零”展示了它的洞察力。和计算机的一贯表现不同,它的行棋方式直观而优美,进攻风格也富有激情。它会冒险采取开局让棋法,在一些棋局中,“阿尔法零”使“鳕鱼”失去了招架之力,并耍得“鳕鱼”团团转,手段看起来既恶毒又残暴。它的创造性溢于言表,能走出任何国际象棋大师或者计算机做梦也想不到的招式。它兼具人类的精神和机器的力量,这是人类第一次见识到如此可怕的新型智能。
假设我们可以利用“阿尔法零”或类似的东西(不妨称之为“阿尔法无穷),去解决理论科学中尚未解决的重大问题,以及免疫学、癌症生物学和意识的相关问题。为了继续这个幻想,我们又假设伽利略模式和开普勒模式存在于这些现象中,并且解决的时机已经成熟,但只能由一种远胜于我们的智能来完成。如果这类定律确实存在,那么超人智能可以找到它们吗?我不知道,也没有人知道。而且,这个问题可能毫无意义,因为这类定律或许根本就不存在。
但如果这类定律存在,而且“阿尔法无穷”能找到它们,那么对我们来说它就好比一个先知。我们将追随它,听从它。虽然我们不明白它为何总是正确的,甚至听不懂它在说什么,但我们可以通过实验或者观测去检验它的计算结果,并且发现它似乎无所不知。我们将变成既惊讶又困惑的旁观者。即使“阿尔法无穷”能自圆其说,我们也无法理解它的推理过程。在那一刻,至少对人类来说,始于牛顿的洞察力时代将会结束,而一个新的洞察力时代将会开启。
这是科幻小说中的情景吗?也许吧。但我认为像这样的情景并非不可能成真。在数学和科学的某些分支领域,我们已经感受到了人类洞察力的黯然失色。有些定理尽管已被计算机证实,但没有人能理解相关证明过程。也就是说,定理是正确的,我们却不知道为什么。而这时候,机器也无法向人类做出解释。
我们以一个由来已久的著名数学问题——四色定理为例。该定理指出,在某些合理的约束条件下,在任何一幅包含接壤国家的地图上,要使相邻两国的涂色不同,仅需4 种颜色即可做到。1977 年,在计算机的帮助下,四色定理得到证实,但没有人能检验论证过程的所有步骤。此后,尽管这个证明过程不断被验证和简化,但其中的某些部分仍不可避免地需要使用蛮力计算,就像在“阿尔法零”出现之前计算机下国际象棋的方法一样。这个证明过程的出现,令许多数学家抓狂不已。他们已经确信四色定理是真的,并且只想知道它为什么是真的,而这个证明过程却毫无帮助。
我们再来看约翰尼斯·开普勒在400年前提出的一个几何问题。该问题要求找出在三维空间中堆放等大球体的最致密方法,类似于杂货店用板条箱装橙子时遇到的问题。将球体码放成多个相同的层,然后一层一层直接堆积起来,这种方法是最高效的吗?或者像杂货店往板条箱里装橙子那样,让层与层之间错开,使每个球体都位于它下方的4个其他球体形成的凹陷处,这种方法是不是更佳?如果是这样,还有其他不规则但更致密的堆积方法吗?开普勒认为杂货店的堆积方式是最好的,但这个猜想直到1998 年才被证明。在他的学生塞缪尔·弗格森和18万行计算机代码的帮助下,托马斯·黑尔斯将计算过程简化为数量虽大但却有限的情况。然后,在蛮力计算和巧妙算法的帮助下,他的程序验证了开普勒猜想。不过,数学界对此反应冷淡。尽管我们现在知道开普勒猜想是正确的,却仍然不明白它为什么正确,黑尔斯的电脑也无法为我们做出解释。
但如果我们用“阿尔法无穷”来解决这些问题,会怎么样呢?这台机器可以给出优美的证明,就像“阿尔法零”和“鳕鱼”的对弈一样, 直观而优雅。用匈牙利数学家保罗·厄尔多斯的话说,这些证明直接来自“那本书”。(厄尔多斯想象上帝有一本书,里面收录了所有最好的证明。)评价某个证明直接来自“那本书”,是对它的最大褒奖。这意味着该证明揭示了某个定理为什么是正确的,而不只是用一些可怕、难懂的论证迫使读者接受它。我能想象,在不久的将来,人工智能会给我们提供来自“那本书”的证明。到那时,微积分会是什么样子,医学、社会学和政治学又会是什么样子?