Thurston:数学中的证明与进展
作者 | William P. Thurston
翻译 | 罗海军
校对 | 陈昱
来源 | 数学译林(2018 年第三期)
排版 | 和乐数学
William P. Thurston
William P. Thurston(1946—2012),美国数学家,1982 年 Fields 奖得主。本文译自:Bulletin(New Series)of the AMS, Vol. 30(1994), No.2, p. 161-177, On proof and progress in mathematics, William P. Thurston.
Jaffe(贾菲)和 Quinn(奎恩)题为“理论数学:走向数学与理论物理的文化综合(Theoretical Mathematics: Toward a cultural synthesis of mathematics and theoretical physics)” 的文章促使我写下了这篇关于数学中的证明与进展的随笔文章。他们在文中提出了数学家们应该关注的有趣的问题,但也延续了一些普遍持有的理念和看法,这些理念和看法仍然值得质疑和检验。
那篇文章(指的是 Jaffe 和 Quinn 的文章。——校注)有一段以一种不同于我的经历的方式描述了我的一些工作,而且这种描述也不同于我要作为一种现实检验而与该领域的研究者有过讨论的那些人们的观察。
经过一番思考,我觉得 Jaffe 和 Quinn 所写的可以作为某种现象的例子,这种现象就是人们往往只看到他们自身所关注的。他们对我工作不恰当的描述源于将数学社会学投射到一个忽略许多基本现象的一维尺度上(推断与严格的对比)。
已经有许多数学家对 Jaffe 和 Quinn 的文章给出了反馈意见,但是我期盼它可以得到来自其他人的许多具体的分析和评论。因此,在本文中我将关注于积极而非消极的方面。我将描述我对数学进展的看法,并且仅仅在作对比的时候偶尔提及一下 Jafe 和 Quinn。
在试图揭开层层假设时,尽量提出合适的问题作为开始是很重要的:
1数学家们实现了什么?
这个问题本身就存在许多问题,我尽量不以一种预示答案本质的方式来叙述。
比如,以“数学家怎么证明定理?”这个问题作为开始,似乎并不是太好。这个问题引出了一个有趣的话题,但是为了开启这个话题,需要给出两个隐性假设:
(1)数学证明中存在一致的、客观的、牢靠的理论和实践, (2)数学家所取得的进展是由定理的证明组成的。
检验这些假设是有必要的,而不是理所当然地接受它们然后从那里进行下去。
这个问题甚至不是:数学家怎样在数学中取得进展?相反,作为这个问题的一种更具体的(首位的)形式,我倾向于:数学家如何增进人类对数学的理解?
这个问题引出了一个基本的和普遍的事实:我们所做的就是寻找让人们理解和思考数学的方式。
由于计算机与人是非常不同的,计算机的快速发展促使人们理解和思考数学的方式发生了戏剧性的变化。例如,当 Appel(阿佩尔)和 Haken(哈肯)使用了巨量的自动运算完成了四色定理的证明时,就引起了大量的争论。在我看来,这些争论几乎不涉及到人们对定理的真实性或者证明的正确性的质疑。这反映出了人们除了渴望知道定理是正确的以外,也保持着一种寻求自身理解的证明的持续渴望。
在更日常的层面上,最常见的是人们用手来完成一些相对小规模的计算然后开始使用计算机来处理大规模的计算。他们可能会打印出前 10000 个质数的表格,结果却发现他们输出的打印并不是他们真正想要的东西。他们通过这种体验发现,他们真正想要的通常不是一些“答案”的集合——他们想要的是理解。
说数学家们正在实现的是增进了人类对数学的理解,这听起来几乎是一种循环论证。我不打算通过讨论数学是什么来解决这个问题,因为它会把我们带到很远的地方。数学 家们普遍认为他们知道什么是数学,但却发现很难给出一个好的直接的定义。尝试一下是很有趣的。对我来说,形式化的模式理论是最接近的,但要讨论这一理论本身就将是一篇完整的文章。
本质上来说很难给数学一个好的直接定义,这是否表明数学有一个基本的递归特性呢?沿着这些思路我们或许可以说数学是满足下面几点的最小的学科:
数学包括自然数、平面和立体几何。 数学是数学家研究的东西。 数学家是那些增进人类对数学的理解的人。
换句话说,随着数学的进步,我们把它融入到我们的思维中。随着我们的思维变得越来越复杂,会产生新的数学概念和新的数学结构:数学主题的改变反映了我们是怎么思考的。
如果我们正在做的是构建更好的思维方式,那么心理和社会维度对于建立数学进展的良好模型来说是必不可少的。流行的模型中没有考虑这些维度。以漫画的方式来讲,流行的模型认为:
D. 数学家们从一些基本的数学结构和一系列关于这些结构的公理开始, T. 关于这些结构有很多重要的问题,它们可以作为正式的数学命题来表述, P. 数学家的任务是寻找一条从公理到命题的演绎途径,或者是否定这些命题。
Jaffe 和 Quinn 的 DSTP 模型仍然没有解决一些基本问题。我们并没有一味去追求一些抽象的定义、定理和证明的产生指标。衡量我们成功与否的标准是,我们所做的事情是否能让人们更清楚、更有效地理解和思考数学。
因此,我们需要问自己:
2人们是如何理解数学的?
这是一个很难回答的问题。理解是一件个人内心活动的事情,这很难充分意识到和难以理解,往往也难以交流。在这里我们也只能略微地来解读它。
人们对于特定数学概念的理解方式有着很大的差异。为了说明这一点,比如有经验的数学家能从多方面来理解,但是我们看到我们的学生却为了理解它在挣扎。函数的导数就很适合(作为一个具体的例子)。导数可以被认为是:
(1) 无穷小:函数值的无穷小变化与函数(自变量)的无穷小变化的比。
(2) 符号: 的导数是 , 的导数是 , 的导数是 ,等。
(3) 逻辑: 当且仅当对于任意的 ,存在 使得当 有.
(4) 几何:导数是函数图像切线(假设切线存在)的斜率。
(5) 速率:的瞬时速度,其中变量 表示时间。
(6) 近似:函数的导数是函数在某点附近的最佳线性逼近。
(7) 微观:函数的导数是你将高阶幂次项放在“显微镜”(这意味着将在处泰勒展开,的高于二次(含二次)的幂次项取极限时为0)下得到的极限。
以上这些是一系列关于导数的不同方式的思考或者构思,而不是关于导数的不同的逻辑定义。除非为了保持人类原始洞察力的直觉去做出不懈努力,否则这些富有启发的概念一旦被转化为精确的、形式化的和明确的定义,那么这些差异就会开始消失。
我记得我曾经把每一个概念都吸收到新的有趣的东西中去,然后花大量的时间和精力去消化和练习,并且和其他人来协调它。我还记得后来我回过头再来审视这些不同的概念,又有了额外的理解和思考。
列举还在继续,没有理由停下来。下面的示例条目可能有助于说明这一点。我们可以认为我们已经知道了关于将要讨论的主题的一切,但转角总会遇到新的洞见。此外, 一个人的聪明想象力是另外一个人的噩梦:
“37. 一个定义在区域 上的实值函数的导数是余切丛的Lagrange (拉格朗日)部分,它给出了在平凡的实丛上唯一的平坦联络形式,并且对于实丛,的图像是平行的。”
这些差异不仅仅来源于一种好奇心。人类的思维和理解不能在单一的轨道上运行,就像一台拥有 CPU (中央处理器)的计算机。我们的大脑和意识像是被组装进了多种功能强大的设备中。这些设备看上去松散地在一起工作,但彼此之间却有组织地进行着高效而非低效地传递。
以下是一些对数学思维非常重要的主要划分:
(1)人类语言。
在语言的表达和理解方面,我们拥有着强大的,并且是独一无二的语言系统,它也与阅读和写作有关。我们的语言系统是思考的重要工具,不仅仅用于沟通。一个浅显的例子是二次求根公式,人们可以把它当作一个小的咏叹调来记忆:“ex equals minus bee plus or minus the square root of bee squared minus four ay see all over two ay"(即的根为“负加或减去(平方减)的平方根再除以”)。符号的数学语言与人类语言系统密切相关。大多数微积分学生都能记得的数学符号的片段只有一个动词,“”。这就是为什么学生在需要动词的时候会用到它。几乎所有在美国教过微积分的人都知道,学生们会本能地写出“”之类的东西。
(2) 视觉,空间感,运动感觉(动觉)。
人们拥有非常强大的系统,可以在视觉上或情感上来获取信息,并且保持空间感。另一方面,人们并没有一个很好的内置的反向视觉系统,即把内部空间的理解转化成一个二维的图像。因此,通常出现在数学家们的论文和书中的图像相比于出现在他们的头脑中的要少得多。
空间思维中有一个有趣的现象是,尺度会产生很大的影响。我们可以想象我们手中的小物体,或者我们可以想象我们扫描的更大点的人类大小的结构,或者我们可以想象包含我们以及我们所处的正在移动的空间结构。我们倾向于认为在更大的尺度上会更有 效地思考空间意象:就好像我们的大脑重视更大一点的事物,并把更多的资源投入到它 们身上。
(3) 逻辑和演绎。
归因推理以及把事物融汇在一起都是我们内置的方式,这些方式与我们怎样进行逻辑演绎有关,这些内置的方式有:因果关系(与蕴含有关)、矛盾或者否定等。
数学家们显然并不像他们所认为的那样通常依赖于形式化的推理规则。相反,他们在头脑中保留了一种合理的逻辑结构,把一些证明分成间接的结果,这样他们就不必同时应付太多的逻辑推理。事实上,优秀的数学家甚至不知道限定词的标准用法(对于所有 的(for all)以及存在(there exists)),但是所有的数学家都按照他们一致认可的推理方式来操作。
有趣的是,尽管“或者”,“和”以及“蕴含”有相同的正式用法,但是我们把“或”以及“和”作为连词,把“蕴含”作为一个动词。
(4) 直觉,联想,隐喻。
人们有令人惊讶的可以感知到某些东西的系统,却不知道这些东西来自哪里(直觉);对于感知到某些现象,或者情况,或者物体,就觉得像别的东西 (联想);然后建立联系和进行比较,并且同时记住这两个东西(隐喻)这些感官系统对于数学来说很重要。就我个人而言,我花了很多精力去“倾听”我的直觉和联想,并将它们构建成隐喻和联系。这涉及到我的大脑需要同时具备宁静和专注。语言、逻辑和具有细节的图片都会抑制直觉和联想。
(5) 刺激反应。
学校经常强调这一点;例如,如果你看到 ,你就会把一个数字写在另一个上面,然后在下面画一条线,等等。这对数学研究也很重要:看到一个纽结的图,我可以用类似于乘法运算法则的过程,写下它的补集的基本群的表示。
过程和时间。
我们有一个用来思考过程或一系列行动的系统,这些行动通常有助于数学推理。一种考虑函数的方式是将它作为一种把定义域投射到值域的作用或者过程。这在复合函数时特别有用。这个系统的另一个功能是记住证明:人们经常将一个证明记作由几个步骤组成的过程。在拓扑学中,同伦的概念通常被认为是一个需要时间的过程。从数学上讲,时间与多加一个空间维度并没有什么不同,但由于人类与时间的互动方式截然不同,心理上的差异可就大不相同了。
3数学理解是如何传递的?
从一个人的理解到另一个人的理解之间的转换并不是自动的。这是困难和棘手的。因此,要分析人类对数学的理解,重要的是要考虑谁来理解,理解什么以及什么时候来理解。
数学家们已经养成了交流的习惯,而这种习惯往往并没有发挥多大作用。研讨会的组织者们到处劝诫演讲者用基本的术语来解释事物。尽管如此,大多数听众在一次普通的座谈会上却并没有收获太多东西。也许他们在最初的 5 分钟内就迷失了,而在剩下的 55 分钟里静静地坐着。或者他们可能很快就会失去兴趣,因为演讲者在没有说明任何研 究它们背景的情况下就投入到了技术细节里面去。在演讲的最后,少数几个与演讲者研 究领域接近的数学家会问一个或两个问题来避免尴尬。
这种模式类似于课堂中经常发生的事情,在课堂上我们装样子讲着我们认为学生应该知道的讲义,而同时学生们却在尽力应付学习我们的语言和猜测我们的心理活动这些更基本的问题。书籍通过提供了解决各种类型的家庭作业的例子,只用来作为补充。教授们通过比课程中涵盖的材料容易得多的作业和测试来弥补,然后对家庭作业和测试进行评分,这当然只需要很少的理解。我们认为问题在于学生,而不是沟通:学生要么不具 备基本所需,要么就是漠不关心.
局外人对这种现象感到惊讶,但在数学界,我们对此不屑一顾。
大部分的困难与数学的语言和文化有关,它们被划分成了各种分支学科。在一个分支学科中每天使用的基本概念通常对于另外一个分支学科来说是陌生的。即使是相近的分支学科,数学家们也不愿意去理解这些基本概念,除非他们是研究生。
相比之下,在数学的学科分支里,交流是很有效的。在一个分支学科中,人们发展出一套共同的知识和已知的技术。通过非正式的接触与交流,人们学会理解和模仿对方的思考方式,这样就可以清晰而轻松地解释想法。
数学知识可以在一个分支学科中快速地传递。当一个重要的定理被证明时,经常(但不总是)发生的情况是,解决方案可以在很短的时间内从该分支学科中的一个人传递到另外一个人。同样的证明通过与该分支学科的成员一个小时的交谈就可以被传递和理解。这将是一个 15 或 20 页纸的文章,可以在几个小时或几天内由该分支学科的成员所阅读和理解。
为什么非正式讨论与文章研讨会之间存在着如此大的反差?面对面的,人们使用广泛的沟通渠道,远远超过形式化的数学语言。他们使用手势,画图像和做图表,以及制造声音效果和使用肢体语言。交流更有可能是双向的,这样人们就可以集中精力在最需要 关注的事情上。通过这些沟通渠道,他们能够更好地表达所发生的事情,不仅是在他们 的逻辑和语言系统上,而且在他们的其他智力系统中。
在研讨会中,人们更拘谨,更正式。数学听众通常不太擅长问大多数人所想的问题,而演讲者往往有一个不现实的预设大纲,防止当他们被问到问题时可以绕过它。
在文章中,人们还是比较正式的。作者把他们的想法转化成符号和逻辑,而读者再尽力翻译回来。
为什么在分支学科内和分支学科外的交流——更不用说与数学学科之外的交流会存在这样的差异?
某种意义上讲,数学有一种共同语言:一套集符号性的语言、技术性的定义、计算和逻辑于一体的语言。这种语言有效地表达了一些,但不是全部的数学思维模式。数学家们学会了将某些难以觉察的事物从一种思维模式转换到另一种思维模式,这样一些陈述很快就变得清晰起来。不同的数学家研究论文的方式各不相同,但当我阅读熟悉领域中的数学论文时,我就会专注于那些字里行间的想法。我可能会仔细阅读几段或几串方程式,然后对自己说,“哦,是的,他们写了太多的废话来执行这样的想法。”当想法清晰的时候,形式的调整通常是不必要和多余的 —— 我经常觉得我自己可以写得更简单些,而不是去理解作者究竟写了什么。就像一个新的烤面包机,附带有 16 页的说明书。如果你已经会用烤面包机了,并且这个新的和你以前见过的类似,你就可以直接插上电,看它是否工作,而不是阅读说明书的所有细节。
在某一分支学科有经验的人可以将各种各样的陈述或公式认作某些概念或心智图像的惯用语或迂回语。但是对于不熟悉接下来将要做什么的人来说,同样的模式不是很有启发性,反而常常误导他们。这种语言对于那些不使用的人来说可以认为是不存在的。
在这里,我想做一个重要的说明:有一些数学家,他们对多个分支学科,有时甚至是相当多的分支学科中思考的方式很熟悉。一些数学家在研究生期间学习了几个分支学科的专业术语,有些人在学习陌生的数学语言和文化方面非常快,有些人在数学中心可以接触到许多分支学科。精通多个分支学科的人通常会有非常积极的影响力,他们充当桥梁,帮助不同的数学家相互学习。但是,熟悉多个学科的人也会有负面影响,通过威胁 他人来维护和保持整个系统普遍不佳的交流。例如,在学术研讨会上经常出现这样的现象,对于听众来说,一到两名知识渊博的人坐在前排来充当演讲者的精神向导。
我们对数学的思考方式和写作方式之间的巨大差异造成了另一种影响。一群数学家之间的互动可以在一段时间内让一系列数学思想保持鲜活,尽管他们的数学著作的记录版本与他们的实际思维不同,前者更强调语言、符号、逻辑和形式主义。但是,当新一批的数学家学习这个学科的时候,他们往往会把他们读到的和听到的东西解释得更确切些,以便更容易地记录和传递这些形式化和机械化的东西,从而逐渐取代其他思维模式。
相较于前一段的影响,这两个影响是积极的影响,所以数学并没有完全陷入形式主义。首先,年轻一代的数学家不断地发现并发表自己的见解,从而将人类思想的不同模式重新注入数学。
其次,数学家们有时会发明名词术语,用统一的定义来代替技术上的累赘,并给出好的见解。像用“群”这样的名称来代替“一个置换系统满足…”,用“流形”来替换“我们不能给出一个整体的坐标系统,同时使得方程的所有解都能够参数化,但是在任何特定解的邻域内我们都可以引入坐标, , , , 其中,10 个由偏导数组成的 矩阵的行列式中至少有一个不等于 0。”
这样的名词术语可能并不代表专家们见解上的进步,但它们极大地促进了见解的传递。
我们数学家需要付出更多的努力来交流数学想法。为了做到这一点,我们需要更多的关注交流,交流不仅限于我们的定义、定理和证明,还有我们的思维方式。我们需要认识到不同的思维方式对于同样的数学结构的价值。
我们需要把更多的精力放在理解和解释数学的基本框架上——因此,对于最近的研究成果,我们的精力就更少了。这就需要发展一种数学语言,它能有效地将想法传达给那些还不了解的人。
这种交流的一部分是通过证明来实现的。
4什么是证明?
当我在伯克利大学读研究生的时候,我很难想象我如何能“证明”一个新的有趣的数学定理。我那时并没有真正理解什么是证明。
通过参加研讨会,阅读论文以及和其他研究生交谈,我逐渐开始理解。在任何学科中,都有一些基本的定理和技术是被大家所熟知,并且普遍接受的。当你在写文章时,你往往不加证明地提及这些熟悉的内容。你在看这个学科领域的其他文章时,你会看到 他们不加证明地引用一些事实,他们把引用的列在参考文献中以供查阅。你从别人那里学到了一些证明的想法,然后你可以方便地引用相同的定理并且按照他们的引用,借鉴相同的内容。你没有必要阅读你参考文献中的全部论文或书籍。有可能发生很多众所周知的事情没有已知的书面出处的情况。只要这个学科的人们对这个想法很满意,就不一定非得要有正式书面材料的出处。
起初,我对这个过程非常怀疑,我怀疑是否真的建立了某种理论。但是我发现我可以问别人,他们可以提出解释和证明,或者让我向其他专业人士请教,又或者给我提供解释和证明的书面材料。当然,也存在一些已经发表的定理通常被认为是错误的,或者它们的证明被认为是不完整的。数学知识和理解植根于思考某一特定主题的那个圈子的人们脑海中和社交关系网中。这种知识通过书面文件来呈现,但书面文件并不是最主要的。
我认为这种模式在不同的学科之间具有很大的差异。我对数学中的几何领域很感兴趣。在这个领域中,用文章来反映人们实际的思考方式,通常是非常困难的。在更代数化的或者符号化的领域中,则并不一定是如此。而且我有这样的印象,在某些学科领域中,文章更接近于反映这个学科的本质。但是无论在何种学科中,都有一个关于有效性和真实性的严格的行业标准。Andrew Wiles(怀尔斯)关于 Fermat(费马)大定理的证明就是一个很好的例子,这个领域更偏向于代数。基于专家们的高水平理解,在他的证明细节还没有被核实之前,专家们很快就相信这个证明基本上是正确的。与大多数数学证明相比,这一证明将受到大量的审核和检验。但无论这个验证的过程耗费多少精力,它都有利于说明数学是如何通过有机的心理和社会过程进行演化的。
当人们在做数学的时候,思想的流动,以及正确有效的社会规范比正式的文章要可靠得多。人们通常不善于检查证明的形式正确性,但他们却很善于发现证明的潜在漏洞或缺陷。
为了避免误解,我想强调两件我没有说的事情。首先,我不主张削弱我们关于证明制定的行业标准;我正在试着描述这个过程是如何发挥作用的。细致的证明经得起仔细的审查,对证明来说非常重要。我认为证明过程在数学界总体上发挥了很好的作用。我提倡的一种改变是,数学家们应该更关注于让他们的证明变得清晰,尽可能简单,这样如果有任何弱点,就很容易被发现。其次,我不是在批评形式化证明的数学研究,我也不是在批评那些把精力投入到使数学论证更加明确和形式化的人。这些都是有利于在数学上产生新的见解的举措。
在我的职业生涯中,我花了相当多的精力通过计算机来探索数学问题。鉴于这一经验,当看到 Jaffe 和 Quinn 的陈述时,我感到很惊讶,他们说,数学是极其缓慢和艰巨的,而且可以说它是所有人类活动中最严谨的学科。但其实能够保证计算机程序正常工作所必需的正确性和完整性的标准比数学行业内关于有效证明的标准要高出好几个数量级。尽管如此,即使经过了非常仔细地编写和测试,大型计算机程序似乎总是有缺陷的。
我认为数学是人类活动中最具智力的,令人满意的学科之一。由于我们对清晰且令人信服的思维有着很高的标准,以及非常重视倾听和理解对方的观点,所以关于数学,我们 不会涉及无休止的争论和无休止的重复。我们时刻准备接受别人的观点。理智地讲,数学的发展非常迅速。整个数学全貌在一个人的职业生涯中以惊人的方式不断地发生着变化。
当人们考虑通过编写计算机程序来反映一篇好的数学文章的知识范围的难易程度时,以及需要耗费多少时间和精力来确保这一过程是几乎正确的和有效的,断言我们实践过的数学几乎是正确的,这本身就是很荒谬的。
我们所从事的数学相比于其他学科更加完善和精确,但是关于它的内容就远没有计算机程序完善和精确。区别不仅仅在于努力的程度:努力的性质也是不同的。在大型计算机程序中,大量的工作必须花费在各种兼容性问题上:确保所有的定义都是一致的,开发具备有效但不繁琐的通用性质的“良好”的数据结构,决定函数的恰当的通用性等等。在一个大型程序的工作部分所花费的能源比例,与记账部分不同,是惊人的小。由于兼容性问题几乎不可避免地需要考虑升级,并且“正确”的定义随着通用性和功能性的增加而改变,计算机程序往往需要重写,甚至是从头开始。
一种非常类似的努力则是必须注入数学使它至少在形式上更加正确和完善。这并不是说,形式上的正确性在小尺度上令人望而生畏,而是因为在小尺度上有许多可能的形式化的选择,它们会转化为大量的相互依赖的选择。要使这些选择相容是相当困难的;要做到这一点,肯定需要从头开始重写所有我们依赖的旧数学论文。对于形式化定义来说,很难找到一个好的技术选择使得这些定义在数学家们想要使用它们的各种方法中是有效的,这将预示着数学未来的扩展方向。如果我们继续追求协调,我们的大部分时间将用来与国际标准委员会一道建立统一的定义并解决巨大的争议。
当数学家受到号召或者激励时,他们能够,并且确实可以填补空白,纠正错误,并提供更多的细节和更仔细的学识。我们的系统非常善于产生可靠的定理,可以得到可靠的备份。只是可靠性并不主要来自于数学家一本正经地去检查形式化的论证;而是来自于数学家对于数学思想的认真并且严肃的思考。
在最基本的层面上,数学的基础比我们所做的数学更不稳定。大多数数学家遵循的基本原则被认为是很虚幻的。例如,它是一个定理,即没有任何方法来实际构造甚至定义一个有序的实数。有相当多的证据(但还没证明)表明,我们可以在不被察觉的情况下侥幸绕开这些虚幻的基本原则,但这并不能证明他们是正确的。集合论学家构建了许多相互矛盾的“数学体系”,如果其中一个是相容的,其他的也一样。这样一来,你就很难相信这个或那个是合适的选择,或自然的选择。哥德尔的不完备性定理意味着不存在一个相容的系统,但它仍然强大,足以作为我们所从事的数学的一个基本准则。
与人类不同,计算机擅长于执行形式化程序。有人正在努力参与用真正形式上正确的形式化推理通过计算机把部分数学真正形式化的研究项目的研究工作。我认为这是一个非常大并且很有价值的项目,我相信我们会从中学到很多。这个过程将有助于简化并阐明数学。在不久的将来,我期盼我们将会有交互式的计算机程序,可以帮助人们编写大量形式上完整和正确的数学(基于一些可能不太可靠但至少是明确的假设),而且这些交互式计算机程序将成为一般数学家开展研究工作的有利条件。
然而,我们应当意识到,我们实际所做的让人类可以理解的和可以检查的证明对我们来说是最重要的,而这与形式化证明是完全不同的。就目前而言,形式化证明是遥不可及的,而且大多无关紧要:我们有一个检验数学有效性的良好的人为过程。
5是什么激发人们去从事数学研究?
在从事数学研究的过程中,通过学习一些思维方式来解释,规划和简化某些事物,这是一种真正的乐趣。人们通过发现新的数学,或者重新发现老的数学,或者从一个人或一个文本中学习一种思维方式,又或者找到一种新的方法来解释或看待一个古老的数学结构,这都可以感受到快乐。
这种内在的动机可能会让我们认为,我们做数学仅仅是为了数学本身。这是不对的:社会环境非常重要。我们会从别人那里得到启发,会寻求他人的欣赏,也乐于帮助别人解决他们所遇到的数学问题。我们感兴趣的事物随着他人的反馈而改变。社会互动是通过面对面的交流产生的。它也通过书面和电子信函、预印本和期刊文章产生。这种高度社会化的数学体系的一种倾向就是数学家们短暂的狂热。为了产生新的数学定理,这可能不是非常有效的:让数学家们更均衡地考虑各知识领域似乎会更好。但大多数数学家都不喜欢孤独,即使他们自己取得了进步,他们也很难对一个课题保持兴奋,除非他们有同事分享他们的喜悦与兴奋。
除了我们的内在动机和我们从事数学的非正式社会动机外,我们还受到经济因素和社会地位的驱使。数学家和其他学科学者一样,需要给出以及受到很多评价。从成绩开始,然后是推荐信、招聘决议、晋升决议、评审报告、邀请报告、奖励…在竞争激烈的体系中,我们参与了许多评级活动。
Jaffe 和 Quin 利用在许多数学家中流行的观点来分析从事数学的动机:定理的功劳。
我认为,我们对定理功劳的过度强调,会对数学的进展产生负面影响。如果我们所做的是增进人类对数学的理解,那么我们就能更好地认识和评估更加广泛的行为。人们在审视定理的证明方式的时候,是站在整个数学圈的背景下进行的;而不是从他们自身出发来看待。一旦一个定理被证明,数学圈就通过社交网络将定理的思想传递给那些可能会进一步应用这些思想的人们那里——在此过程中,影印媒介就显得太复杂,太累赘了。
即使有人以狭隘的观点认为我们所做的就是定理,那团队也很重要。足球可以用来作为一个比喻。在一场足球比赛中,可能只有一到两个进球,由一到两个人踢进。但这并不意味着其他所有人的努力都白费了。我们不会仅仅通过他们个人是否取得进球来评判一个足球队的球员;我们根据是他在团队中发挥的作用来评判这个队员。
数学中经常发生这样的情形,一群数学家用某些想法推动数学前进。在这些前进的方向上有一些定理几乎不可避免地会被一个人或另一个人证明。有时候,数学家们甚至可以预测出这些定理可能是什么。然而要预测谁将真正证明这个定理则要困难得多,尽管通常有一些“高手”更受青睐。然而,由于团队的共同努力,他们可以证明这些定理。团队有一个更进一步的作用,一旦定理被证明了,就会吸收和使用它们。即使一个人能够独自证明这个方向上的所有定理,如果没有其他人去了解它们,它们也会被浪费掉。
关于这些“高手”有一种有趣的现象。经常发生的情况是,在一帮人中的某些人证明了一个被普遍认为重要的定理。那么他们在圈内的地位—— 他们的权势 —— 会迅速而显著地上升。当这种情况发生时,他们通常会变得更加多产,成为思想的中心和定理的来源。为什么?首先,自尊心有了很大的提升,随之而来的是生产力的提高。其次,当他们的地位上升时,他们更多地处于思想交流网的中心,而其他人则更重视他们。最后,或许最重要的是,数学上的突破通常代表一种新的思维方式,而有效的思维方式通常可以应用于很多方面。
这一现象让我相信,如果我们开拓视野,挖掘我们所做的事情中的真正价值,那整个数学圈将会变得更加高效。Jaffe 和 Quinn 提出了一套角色可识别系统,并将角色分为 “猜测”和“证明”。这样的划分只会延续这样一个错误观念:数学的进步是靠一系列标准 定理的演绎来衡量的。这有些荒谬,就像是一个人可以写出前 10000 个素数一样。我们所要创造的其实是理解。我们要有许多不同的解读方式,以及能够帮助我们解读的许多不同的过程。如果我们意识到,并且专注于此,我们将会更满足,更高效,也会更幸福。
6一些个人的经验体会
由于我写这篇文章的缘由是 Jaffe 和 Quinn 的描述与我的个人经验不相符,所以我将讨论我的两个个人经验,包括他们提到过的一个。
对此我感到有些汗颜,因为我确实对我的职业生涯的一些方面感到遗憾:我如果当时就拥有了现在对于自己的认识和对于数学过程的洞见,再来做一些事情,那将会有很大的不同。我希望把我记忆中的和我所理解的经验坦诚地描述出来,这样能够帮助他人更好地领会,并能够提前有所领悟。
首先,我将简要讨论下叶状结构理论,这是我的第一个课题,从我读研究生开始。(这里你是否知道什么是叶状结构并不重要。)
在那个时候,叶状结构已经成为几何拓扑、动力系统和微分几何的一个重要的中心。我很快证明了一些令人惊讶的定理。我证明了关于叶状结构的分类定理,并且对于含有一个叶状结构的流形给出了一个充要条件。我证明了一些其他的重要定理。我写了让人钦佩的文章,发表了被认为是最重要的定理。用于写证明的时间很难赶得上我可以证明的定理,因而我就有了一些积压的内容而没有写出来。
一个有趣的现象出现了。就在几年的时间里,该领域的研究者竟然戏剧性地开始撤离这个领域,我从许多数学家那里都听到,他们要么是建议别人,要么是得到别人的劝谏:不要再进入叶状结构的这个研究领域--Thurston 正在"清理"这个领域。人们告诉我(不是抱怨,而是恭维),我正在扼杀这个领域。研究生们停止了对叶状结构的研究,很快,我也转向了其他方面的兴趣爱好。
我不认为撤离发生的原因是该领域已经枯竭了,许多有趣的问题一直(现在仍然是)存在,而且是有可能做出来的。自从那些年以来,留在这个领域或进入该领域的少数人取得了一些有意思的进展,而且我认为一些发展很快的邻近学科中的重要进展,使得数学家们可以继续积极地来探索叶状结构理论。
今天,几乎没有几个数学家能够理解叶状结构的艺术精髓,而在它富有活力的那个时期,却不是这样。尽管如此,叶状结构理论的某些方向,包括从它火热的时期延续过来 的一些进展,也仍然在蓬勃成长着。
在我看来,对于抑制这个理论发展的两个生态学因素比出现任何智力资源的枯竭更加重要。
首先,我所证明的结果(以及其他人的一些重要结果)都以一种传统的、令人生畏的数学家的风格方式来记录。他们很大程度上依赖于有一定背景和见解的读者。叶状结构理论是一门年轻的,有活力的分支学科,并不需要专门的背景。我毫不犹豫地利用我从别人那里学到的数学知识。我写的论文没有(也不能)花很多时间来解释背景文化。他们记录了我在经过认真思考和努力之后,得到的高层次的论述和结论。我还抛出了一些珍贵的见解,比如“Godbillon-Vey 不变量测量叶面的螺旋摆动”,这对大多数读过它们的数学家来说仍然是神秘的。这就产生了一个很高的门槛:我认为许多研究生和数学家对于学习和理解核心定理的证明这个过程所产生的困难感到灰心。
其次是这个分支学科其他人所关注的问题。当我开始研究叶状结构的时候,我那时的想法是人们想要的只不过是知道答案。我曾认为他们所寻求的无非是被证明了的,并且是强有力的定理,这些定理可以被用来回答更进一步的数学问题。但这只是事情的一部分。人们其实想拥有的是自己独特的理解,而不仅仅是拥有知识本身。并且在我们以功利为先的系统里,他们也想要并且需要定理所带来的功利。
我将跳过几年,直接到 Jaffe 和 Quinn 提到的主题,那时我开始研究三维流形和它们与双曲几何的关系。(再说一次,对于是否了解这具体是什么东西无关紧要。)我逐渐积累了多年来对双曲三维流形的某种直觉,并掌握了一整套构造、实例和证明。(这个过程实际上是在我还是大学生的时候就开始的,并且通过应用到叶状结构的过程中受到强烈的鼓舞。)一段时间后,我猜测或推测所有三维流形都具有某种几何结构;这个猜想最终 被称为几何化猜想。大约两三年后,我证明了对于 Haken 流形的几何化定理。这是一个很难的定理,我花了大量的精力去思考它。当我完成了证明,我花了更多的精力检查证明,寻找难点和用相互独立的信息来验证它。
当我说我证明了这个定理的时候,我想多说几句来解释这意味着什么。这意味着我有一个清晰而完整的想法,包括细节,这些都经受住了我自己和其他人大量的检查。数学家有许多不同的思考风格。我的风格不是泛泛而谈,这仅仅是暗示或启发:我在头脑中建立了很清晰的模型,并且全盘思考整个事情过程。我的证明事实上是相当可靠的。我并没有为我已经证明的事情来补充论述和细节这样的麻烦。我善于发现自己推理中的缺陷,也善于发现他人推理中的缺陷。
然而有时候,将我自己的想法转述给其他人,这过程中有些事情会出现很大的偏差。我的数学教育是相当独立和特殊的,多年来我自学了一些东西,发展了个人心智模型来思考数学。这对我思考数学来说是一个很大的优势,因为对我来说,之后很容易学到其他数学家所分享的标准心智模型。这意味着在我个人看来是自然而然,经常使用的一些概念,对于我要面对的大多数数学家来说都是陌生的。我个人的心智模型和结构在特点上与其他数学家所具有的模型相似,但它们通常是不同的模型。在几何化猜想形成的过程中,我对双曲几何的理解是一个很好的例子。一个随机的连续的例子是对有限拓扑空间的理解,一个古怪的话题却可以很好地洞察各种各样的问题,但在任何情况下这都不值得发展,因为存在一些标准的、迂回的说法可以避免这样的事情发生。
无论是几何化的猜想还是关于 Haken 流形的几何化猜想证明在那个时候都没有任何数学家研究过——它在过去的 30 年里与拓扑学的趋势背道而驰,它让人们感到惊讶。对于当时的大多数拓扑学家来说,双曲几何是数学的一个神秘的分支,尽管还有其他一些数学家,比如微分几何学家,他们确实从某些角度理解过它。拓扑学家花了一段时间才明白了几何化猜想是什么,它用来做什么,以及它为什么是意义的。
与此同时,我开始写有关三维流形的几何与拓扑的笔记,与我所教的研究生课程相结合。我把它们发给了一些人,不久之后,世界各地的许多人都在写复制本。邮寄名单增加到大约 1200 人,每隔几个月我就会给他们邮寄笔记过去。我尽量在这些笔记中表达我真实的想法。人们根据我的笔记举办了很多研讨会,并且我也得到了很多反馈。绝大多数的反馈都是这样的:“你的笔记真的很有启发性,很优美,但是我必须告诉你,我们花了 3 个星期的时间来研究n.n节的细节,这里如果有更多的解释肯定会有所帮助。”
我也向一些数学家介绍了从几何学的角度研究三维流形的想法,以及关于 Haken 流形的几何化猜想的证明。一开始,几乎所有人都对这个话题感兴趣。但这是很难沟通的—— 因为基本框架在我的头脑中,而不是在数学团体中。在这一系列的想法中涉及几个方面的数学理论:三维拓扑流形,Klein(克莱因)群,动力系统,几何拓扑,Lie(李)群的离散子群,叶状结构,Teichmuller(泰希米勒)空间,伪 Anosov(阿诺索夫)微分同胚,几何群论,以及双曲几何。
1980 年,我们在 Bowdoin 学院举办了一个 AMS 暑期研讨班,许多低维拓扑,动力系统以及 Klein 群领域内的数学家都来了。
文化交流是一种有趣的体验。很明显,对于证明理解的程度取决于听众。我们在社会背景下证明事物,并向特定的听众发表演说。对于有些证明我可以用两分钟的时间就传递给拓扑专家,但对分析学家需要一个小时的讲座才能开始理解。类似地,有些事情可以在两分钟内向分析学家说清楚,而让拓扑学家明白需要一个小时的时间。还有很多其他的证明从理论上讲只需要花两分钟的时间就可以理解,但没有一个听众能在不到一个小时的时间内就明白它们的内在结构。
当时,对于这个定理几乎没有实际的模型和实际的背景,因此对于从我头脑中的一个关键想法到我不得不表述出来,更不要提听众得花费多少精力去理解它,这过程之间的差异是非常巨大的。
鉴于我关于叶状结构理论的经验以及对社会压力的回应,我把大部分注意力集中在发展和呈现我所写的以及我和人们讨论的一些事物的基本架构上。我向少数几个了解叶状结构理论的人解释了细节。我写了一些论文来给出关于 Haken 流形的几何化定理证明的实质部分——对于这些论文,我几乎没有得到任何反馈。同样地,很少有人能够在短时间内,理解我笔记中更困难、更深刻的部分。
导致的结果就是,现在相当多的数学家在一开始就戏剧化地缺少对一些概念和结构的深刻理解,而这些基本的概念和架构对这个领域来说又是非常自然和基本的。一直以来都有大量的数学活动蓬勃发展。通过集中精力构建基本结构,解释、发表定义和思考方式,但在陈述或发表我知道如何证明的所有“定理”的证明时,节奏缓慢,这其实给许 多其他人留下了获取功绩的空间。对于人们来说还存在很大的空间去发现或者发表几何 化定理的其他证明。这些证明有助于发展数学概念,这些概念本身就是非常有趣的,并 将导致数学进一步发展。
在我看来,数学家最想要的和最需要的是学习我的思考方式,而不是去学习我关于 Haken 流形的几何化猜想的证明。一般形式的几何化猜想的证明不太可能通过同样的证 明继续推进来实现。
另一个问题是,人们有时需要或想要一个被接受和被验证的结果,而不是为了学习它,这样他们就可以引用它并依赖它。
基于他们自身的经验和对我的信任,以及基于那些我花了很多时间来交流证明过程的专家那里的意见,数学家们实际上很快就接受了我的证明,并开始引用它。通过我和其他人发表的文章,这个定理现在已经形成详实的文件,所以大多数人都觉得引用它是安全的;这个领域还没有人质疑它的有效性,或者向我表达某些细节是无效的。
并非所有的证明都在我们为数学所构建的逻辑框架中扮演着相同的角色。这个特别的证明可能暂时具有逻辑价值,尽管它具有很强的动机用来支持对三维流形结构的某种观察。完整的几何化猜想仍是一个猜想。它在很多情况下已经被证明,并且得到了大量的计算机方面的证据的支持,但是它还没有从一般性上予以证明。我相信一般性的证明将被发现:我希望再过几年。到那时,特殊情况的证明很可能会过时。
与此同时,想要使用几何技术的人们最好先“假设 是一个具有几何分解的流形”, 因为这相比“假设 是一个 Haken 流形”更具一般性。那些不想使用这项技术的人或者怀疑它的人可以避免使用它。即使关于 Haken 流形的定理可以用几何方法证明,但是寻找到一种纯拓扑方法来证明它也是很有意义的.
在这过程中(它还在继续)我认为我已经设法避免两个可能最严重的后果:要么我不透露我已经发现的和证明的,只让自己知道(也许保留着证明 Poincare(庞加莱)猜想的希望,或者我呈现一个不可攻破,很难学习的理论,这个理论没有人能够让它丰富和发展。
我可以很容易地说出我职业生涯中的遗憾。我没有尽可能多地发表文章。除了对于 Haken 流形的几何化定理之外,还有许多数学课题我并没有很好地或者根本没有向数学大众传达出来。当我把更多的精力放在基础架构的发展上,而不是在三维流形的几何理论的顶层设计时,随着这个学科继续发展我就有点脱离了。我并没有积极或有效地促进这个领域或这个领域内优秀人才的职业生涯发展。(但是某种程度上的脱离似乎对我来说是指导研究生和其他人几乎不可避免的结果:为了真正把纯粹的研究方向传递给他人,我们必须释然并且不要让他人认为这些研究方向很难。)
另一方面,在许多不同的活动中,我一直都很忙并富有成效。我们的系统不会为像我 这样的人创造额外的时间用于写作和研究;相反,许多请求和申请把我们额外工作的时 间给占用了,我的直觉反应是对许多请求和申请说“同意”。我已经把很多精力投入到那 些不会产生“功绩“的活动,但这些活动我认为和证明定理一样有价值:数学政治学、修订我的笔记成一本更方便交流的书籍、探索计算机在数学中的应用、数学教育、通过几何中心发展新的数学交流形式(如我们的第一个实验中,“Not, Knot”视频)、指导 MSRI 等等。
我认为我所做的并没有将我的“功绩”最大化。我一直都认为没有太多必要去争取更 多的“功绩”。事实上,包括证明新的定理在内,我开始感到来自其他事情的挑战正在变 得越来越大。
我确实认为我的行为在促进数学方面做得很好。