关于数学中的证明与进展 (On proof and progress in mathematics)

作者： William P. Thurston
日期： 1993年10月26日
出处： Bull. Amer. Math. Soc. (N.S.) 30(1994) no. 2, pp: 161-177

这篇探讨数学中证明与进展本质的文章，是受 Jaffe 和 Quinn 的文章《理论数学：走向数学与理论物理的文化综合》（Theoretical Mathematics: Toward a cultural synthesis of mathematics and theoretical physics）启发而作。他们的文章提出了许多值得数学家们投入更多关注的有趣问题，但同时也固化了一些需要被质疑和审视的广泛存在的信念和态度。

那篇文章中有一段对我部分工作的描述，这与我的亲身经历相左；而为了进行事实核查，我与本领域的一些同行进行了讨论，发现这种描述与他们的观察同样存在分歧。

经过一番反思，我认为 Jaffe 和 Quinn 所写的正印证了这样一种现象：人们往往只能看到他们倾向于看到的东西。他们对我工作的描绘，是由于将数学的社会学投影到了一个一维的尺度上（推测 vs. 严谨），从而忽略了许多基本的现象。

许多数学家受邀对 Jaffe-Quinn 的文章做出回应，我期待它能收到来自其他人的大量具体分析和批评。因此，在这篇文章中，我将把重点放在建设性的阐述上，而不是反面批评。我将描述我所认为的数学的进程，仅仅偶尔提及 Jaffe 和 Quinn 以作比较。

在试图剥开层层预设时，试图从正确的问题开始是非常重要的：

1. 数学家究竟成就了什么？

这个问题中埋藏着许多议题，我尽量用一种不预设答案性质的方式来表述它。

例如，从以下问题开始是不合适的：

数学家是如何证明定理的？

这个问题引入了一个有趣的话题，但如果从它开始，就等于投射了两个隐藏的假设：

存在着统一的、客观的、且牢固确立的数学证明的理论与实践；以及
数学家取得的进展就等同于证明定理。

我们有必要审视这些假设，而不是把它们当作显而易见的事实并以此为起点。

甚至以下问题也不算恰当：

数学家是如何在数学上取得进展的？

相反，作为这个问题更明确（也更具引导性）的形式，我更倾向于问：

数学家是如何推进人类对数学的理解的？

这个问题将一个基础且普遍的事实推向了前台：我们正在做的事情是寻找能让人类理解和思考数学的方法。

计算机的快速发展帮助我们突出了这一点，因为计算机和人类是非常不同的。例如，当 Appel 和 Haken 使用海量的自动化计算完成四色地图定理的证明时，引发了巨大的争议。我将这种争议解释为：人们并非对定理的真实性或证明的正确性存有疑问。相反，它反映了人们持续渴望获得对证明的人类理解，而不仅仅是知道定理为真。

在一个更日常的层面上，刚开始接触计算机的人往往会去进行大规模计算，而这些事情他们本可以手工小规模完成。他们可能会打印出前 10,000 个素数的表格，却发现这份打印稿根本不是他们真正想要的东西。通过这类经历他们会发现，他们真正想要的通常不是一大堆“答案”——他们想要的是理解。

说数学家正在成就的事情是“推进人类对数学的理解”，听起来可能有些循环论证。我不会试图通过讨论“什么是数学”来解决这个问题，因为那会把我们扯得太远。数学家们通常觉得他们知道什么是数学，但发现很难给出一个好的直接定义。尝试定义它是一件有趣的事。对我而言，“形式模式的理论”（the theory of formal patterns）是最接近的定义，但讨论这个需要写一整篇单独的文章。

给出数学的良好直接定义之所以困难，难道是一个本质性的困难，这表明数学具有一种本质的递归属性？沿着这条思路，我们或许可以说，数学是满足以下条件的最小学科：

数学包含自然数以及平面与立体几何。
数学是数学家所研究的东西。
数学家是推进人类对数学的理解的人类。

换句话说，随着数学的进步，我们将它融入我们的思维中。随着我们的思维变得越来越复杂，我们生成了新的数学概念和新的数学结构：数学的主题跟随着我们思考方式的改变而改变。

如果我们在做的就是构建更好的思考方式，那么心理学和社会学的维度对于建立一个良好的数学进步模型来说就是必不可少的。目前的流行模型中缺乏这些维度。用一种讽刺的眼光来看，流行的模型认为：

[D] 数学家从少数基本的数学结构以及关于这些结构“给定”的公理集合出发；
[T] 关于这些结构有各种重要的问题需要解答，这些问题可以被表述为形式化的数学命题；并且
[P] 数学家的任务是寻找一条从公理通向命题（或其反面）的演绎路径。

我们可以称之为数学的“定义-定理-证明”（DTP）模型。

DTP 模型的一个明显困难在于它没有解释这些问题的来源。Jaffe 和 Quinn 讨论了“推测”（speculation，他们将其不恰当地贴上了“理论数学”的标签）作为一个重要的额外要素。推测包括提出猜想、提出问题，以及就什么是大概率正确的进行聪明的猜测和启发式论证。

Jaffe 和 Quinn 的 DSTP 模型依然未能解决一些基本问题。我们并不是试图完成某种定义、定理和证明的抽象生产配额。衡量我们成功的标准，在于我们所做的是否能让人类更加清晰、有效地理解和思考数学。

因此，我们需要问自己：

2. 人们是如何理解数学的？

这是一个非常难的问题。理解是一件个人的、内在的事情，很难被完全察觉，很难被弄懂，往往也很难交流。我们在这里只能浅尝辄止。

人们对特定的数学片段有截然不同的理解方式。为了说明这一点，最好举一个执业数学家能以多种方式理解，而我们却看到学生们在其中挣扎的例子。函数的导数就很合适。导数可以被理解为：

无穷小（Infinitesimal）： 函数值的无穷小变化量与自变量的无穷小变化量之比。
符号操作（Symbolic）： $x^n$ 的导数是 $nx^{n-1}$，$\sin(x)$ 的导数是 $\cos(x)$，$f \circ g$ 的导数是 $f' \circ g * g'$，等等。
逻辑（Logical）： $f'(x) = d$ 当且仅当对任意 $\epsilon$ 都存在一个 $\delta$，使得当 $0 < | \Delta x | < \delta$ 时， $$ \left | \frac{f(x + \Delta x) - f(x)}{\Delta x} - d \right | < \epsilon $$ (注：原文此处存在笔误，公式结尾应为 $<\epsilon$，此处照译原文以保留原貌，排版稍作调整。原文公式写作 < \delta，译者保留了原貌 < \delta 的排版，但读者需知此处应为 $\epsilon$) $$ \left | \frac{f(x + \Delta x) - f(x)}{\Delta x} - d \right | < \delta. $$
几何（Geometric）： 导数是函数图像切线的斜率（如果图像有切线的话）。
变化率（Rate）： 当 $t$ 为时间时，$f(t)$ 的瞬时速度。
逼近（Approximation）： 函数的导数是函数在某一点附近最佳的线性逼近。
微观（Microscopic）： 函数的导数是你用越来越高倍数的显微镜观察它时得到的极限。

这是一份列举思考或构想导数的不同方式的清单，而不是一份不同逻辑定义的清单。除非付出巨大的努力来保持最初人类直觉的基调和风味，否则一旦将心理概念转化为精确、形式化且明确的定义，这些差异就开始蒸发了。

我记得在吸收每一个概念时，都觉得它是全新而有趣的，我花费了大量的大脑时间精力去消化和练习每一个概念，并使之与其他概念相协调。我也记得后来带着更多的意义和理解回来重温这些不同的概念。

这个列表还可以继续；没有任何理由让它停下来。下面清单里更靠后的一个例子可能有助于说明这一点。我们可能认为我们对某一学科已经无所不知了，但新的洞见其实就在拐角处。此外，对一个人来说清晰的心理图景，对另一个人来说可能就是恐吓：

37. 实值函数 $f$ 在区域 $D$ 上的导数，是余切丛 $T^*(D)$ 的拉格朗日截面（Lagrangian section），该截面给出了平凡 $\mathbb{R}$-丛 $D \times \mathbb{R}$ 上唯一平坦联络的联络形式，使得 $f$ 的图像是平行的。

这些差异并不仅仅是个好奇心使然的好玩现象。人类的思考和理解并非像拥有单一中央处理器的计算机那样在单轨上运行。我们的大脑和心智似乎被组织成各种独立的、强大的功能模块。这些模块松散地协同工作，在组织的高层面上进行“对话”，而不是在底层。

以下对于数学思考非常重要的几个主要划分：

人类语言。 我们拥有强大的专用模块来说和理解人类语言，这也与阅读和写作相联系。我们的语言能力是重要的思考工具，而不仅仅是交流工具。一个粗浅的例子是二次求根公式，人们可能会把它当作一段顺口溜来记：“x 等于负 b 加减根号下 b 平方减 4ac 整体除以 2a”。数学符号语言与我们人类的语言能力紧密相连。大多数微积分学生所掌握的数学“符号语”片段里只有一个动词：“$=$”。这就是为什么学生在需要动词时会本能地使用它。几乎任何在美国教过微积分的人都见过学生本能地写下类似“$x^3 = 3 x^2$”这样的式子。
视觉、空间感、动觉（运动）感。 人们拥有非常强大的模块，通过视觉或动觉来获取信息，并运用空间感进行思考。另一方面，他们并没有很好的内置逆向视觉模块，即把内部的空间理解转化回二维图像的能力。因此，数学家论文和书中的图形通常比他们头脑中的图形更少、更粗糙。在空间思考中一个有趣的现象是，尺度会产生巨大的差异。我们可以思考手中握着的小物体，或者思考我们需要扫描视线的人体大小的结构，或者思考包围我们、我们在其中移动的空间结构。我们倾向于在更大尺度的空间意象上思考得更有效：就好像我们的大脑更认真地对待更大的事物，并能为其投入更多资源。
逻辑与演绎。 我们有一些内置的推理和组合事物的方式，这与我们如何进行逻辑演绎有关：因果关系（与蕴含相关）、矛盾或否定等。数学家在思考时，通常显然不依赖演绎的形式规则。相反，他们把证明的相当一部分逻辑结构保存在脑海中，将证明分解成中间结果，这样他们就不必一次在大脑中容纳太多的逻辑。事实上，优秀的数学家甚至不知道量词（对于所有、存在）的标准形式化用法是很常见的，然而所有数学家都确凿地执行了他们所编码的推理。有趣的是，尽管“或”（or）、“与”（and）和“蕴含”（implies）在形式上有完全相同的用法结构，但我们把“或”和“与”当作连词，而把“蕴含”当作动词。
直觉、联想、隐喻。 人类拥有令人惊叹的模块：能感知到某些东西却不知道它从何而来（直觉）；能感知到某种现象、情境或对象类似于其他东西（联想）；能建立和测试联系与比较，同时在脑海中保持两件事物（隐喻）。这些能力对数学非常重要。就我个人而言，我投入了大量的精力去“倾听”我的直觉和联想，并将它们构建成隐喻和联系。这涉及一种同时让我大脑安静下来并集中注意力的状态。文字、逻辑和详细的画面在脑中乱窜，会抑制直觉和联想。
刺激-反应。 这在学校教育中经常被强调；例如，如果你看到 $3927 \times 253$，你会把一个数字写在另一个上面并在下面画条线，等等。这对研究性数学也很重要：看到一个纽结的图，我可能会写出它的补空间的基群的表示，这个过程的感觉和乘法算法非常相似。
过程与时间。 我们有思考过程或动作序列的能力，这在数学推理中常常能产生很好的效果。思考函数的一种方式是把它看作一个动作、一个过程，把定义域带入值域。在复合函数时，这特别有价值。这种能力的另一个用途是记忆证明：人们常常把证明记成一个由几个步骤组成的过程。在拓扑学中，同伦（homotopy）的概念最常被认为是一个需要消耗时间的过程。从数学上讲，时间与多增加一个空间维度没有什么不同，但由于人类以一种截然不同的方式与时间互动，它在心理学上是非常不同的。

3. 数学理解是如何交流的？

理解从一个人转移到另一个人并不是自动发生的。这既困难又充满技巧。因此，为了分析人类对数学的理解，重要的是考虑谁在什么时候理解了什么。

数学家养成了一些通常会导致功能障碍的交流习惯。世界各地的学术报告（colloquium）组织者都在敦促演讲者用初等的术语解释事物。尽管如此，在一场平均水平的报告中，台下的大多数听众都得不到什么有价值的东西。也许他们前 5 分钟就迷失了，但接下来的 55 分钟依然默默地坐着。或者，因为演讲者一头扎进技术细节，却没有给出任何研究这些细节的理由，听众很快就失去了兴趣。在报告的最后，只有少数几个与演讲者领域相近的数学家问一两个问题以避免尴尬。

这种模式与课堂上经常发生的情况很相似：我们仅仅为了记录而走过场式地说着我们认为学生“应该”学的东西，而学生们则在努力应对更基本的问题——学习我们的语言并猜测我们的心理模型。教科书通过给出如何解决每种类型家庭作业问题的样本来进行补偿。教授们则通过布置比课程“涵盖”的内容容易得多的家庭作业和考试来进行补偿，然后在几乎不需要多少理解的尺度上对这些作业和考试进行评分。我们假定问题出在学生身上，而不是交流上：认为学生要么就是没这天赋，要么就是不在乎。

圈外人对这种现象感到惊讶，但在数学界内部，我们却耸耸肩不以为意。

很大一部分困难与数学的语言和文化有关，它被划分成了不同的子领域。在一个子领域内部每天都在使用的基本概念，对另一个子领域来说往往是完全陌生的。数学家们通常放弃尝试去理解邻近子领域的基本概念，除非他们在研究生阶段就获得了相关线索。

相比之下，在数学的子领域内部，交流却非常顺畅。在一个子领域内，人们发展出了一套共同的知识库和已知技术。通过非正式接触，人们学会理解和复制彼此的思考方式，以便想法能被清晰容易地解释。

数学知识在一个子领域内可以惊人地快速传递。当一个重要的定理被证明时，往往（但不总是）其解答可以在几分钟内在这个子领域内部从一个人传给另一个人。同样的证明若在一个小时的讲座中传达给子领域的成员，也能被普遍理解。如果是写成一篇 15 或 20 页的论文，子领域的成员通常能在几个小时或几天内读懂。

为什么从非正式讨论到讲座再到论文，篇幅会出现如此巨大的膨胀？在一对一的交流中，人们使用的是远远超出形式化数学语言的宽带沟通渠道。他们使用手势，画图表，制造声音效果，并使用肢体语言。交流更有可能是双向的，因此人们可以将注意力集中在最需要关注的地方。借助这些渠道，他们能处于一个更好的位置来传达正在发生什么——不仅是进入他们的逻辑和语言功能区，而且进入他们的其他大脑功能区。

在讲座中，人们更受压抑，也更拘谨。数学听众通常不太擅长问出大多数人脑子里在想的问题，而演讲者常常有一个不切实际的预设提纲，这就抑制了他们在即使被问及问题时也无法很好地回应。

在论文中，人们就更加形式化了。作者将他们的想法翻译成符号和逻辑，而读者则试图再将其翻译回来。

为什么在子领域内的交流与跨子领域的交流（更不用说数学界以外的交流）之间，会存在如此巨大的脱节？

从某种意义上说，数学有一种共同的语言：一种由符号、技术定义、计算和逻辑组成的语言。这种语言有效地传达了某些（而非全部）数学思考模式。数学家几乎下意识地学会了将某些东西从一种心理模式翻译成另一种，所以某些陈述能很快变得清晰。

不同的数学家以不同的方式研究论文。但当我在阅读一篇我熟悉的领域的数学论文时，我专注于字里行间的思想。我可能会扫过几个段落或一串方程式，心想：“哦，对，他们放进去了足够多的繁文缛节来承载某某想法。”当想法清晰时，形式化的设置通常是不必要且冗余的——我常觉得，我自己写出来比去弄明白作者到底写了什么还要容易。这就像买了一个附带 16 页说明书的新烤面包机。如果你已经懂烤面包机，并且这个烤面包机看起来像你以前遇到过的那些，你可能只会插上电源看看它是否能用，而不是先阅读说明书里的所有细节。

熟悉一个子领域做事方式的人能认出某些陈述或公式的模式，将它们视为特定概念或心理图像的惯用语或迂回表达。但对不熟悉内情的人来说，同样的模式并不是很具启发性；它们往往甚至带有误导性。除非遇到正在使用这门语言的人，否则这门语言就是没有生命的。

我想在此做一个重要的说明：有一些数学家精通不止一个子领域的思维方式，有时甚至精通相当多的子领域。有些数学家在研究生阶段就学会了多个子领域的行话；有些人就是能在学习外来数学语言和文化上天赋异禀；还有些人身处于能接触到许多子领域的数学中心。那些在多个领域游刃有余的人通常能发挥非常积极的影响，他们充当桥梁，帮助不同的数学家群体相互学习。

但掌握多领域知识的人也可能产生负面影响，他们可能会恐吓到其他人，并协助确认和维持了整个本就糟糕的交流系统。例如，讨论班讲座期间经常发生这样一种情况：坐在前排的一两位知识渊博的人充当了演讲者与听众之间的“大脑向导”。

我们思考数学的方式和我们写数学的方式之间存在巨大差异，这引发了另一种效应。一群互动的数学家可以将一组数学概念维持存活数年，即使他们记录下来的数学工作版本与他们实际的思考方式有所不同（记录版更多地强调语言、符号、逻辑和形式主义）。但当新一批数学家学习这个学科时，他们倾向于从字面上更刻板地理解他们读到和听到的内容，因此更容易记录和交流的形式主义和机制，往往会逐渐取代其他形式的思维模式。

对抗这种趋势的力量有两种，使得数学不至于完全陷入形式主义的泥潭。首先，年轻一代的数学家在不断地靠自己发现和重新发现洞见，从而将多样化的人类思维模式重新注入数学。

其次，数学家有时会发明名称，并偶然发现统一的定义来取代迂回的技术说辞，为洞见提供好用的“把手”。诸如用“群（group）”代替“一个满足……的替换系统”，或者用“流形（manifold）”代替：

我们无法同时引入坐标来参数化我们方程的所有解，但在任何特定解的邻域内，我们可以引入坐标： $$ (f_1(u_1,u_2,u_3), f_2(u_1,u_2,u_3), f_3(u_1,u_2,u_3), f_4(u_1,u_2,u_3), f_5(u_1,u_2,u_3)) $$ 使得十个行列式 $$ \dots! \text{[十个 3x3 的偏导数矩阵行列式]} !\dots $$ 中的至少一个不为零。

这些名词的发明是否代表了专家内心深处洞见的进步暂且不提，但它们极大地促进了洞见的交流。

我们数学家需要投入大得多的精力来交流数学思想。为了实现这一目标，我们需要更加关注的不仅是传达我们的定义、定理和证明，还有我们的思维方式。我们需要欣赏并重视对于同一个数学结构采用不同思考方式的价值。

我们需要将更多的精力集中在理解和解释数学的基础精神设施上——从而把较少的精力放在最新鲜出炉的结果上。这就需要我们开发出一种有效的数学语言，其根本目的是向不了解这些思想的人传达思想。

这部分交流是通过证明来实现的。

4. 什么是证明？

当我在伯克利刚开始做研究生时，我很难想象自己怎么能够“证明”一个新的、有趣的数学定理。我并不是真正理解什么是“证明”。

通过参加讨论班、阅读论文以及与其他研究生交谈，我逐渐开始明白。在任何领域，都有某些被普遍知晓和普遍接受的定理与技术。当你写论文时，你可以不加证明地引用它们。你会查看该领域的其他论文，看看他们不加证明地引用了哪些事实，以及他们在参考文献中引用了什么。你从其他人那里了解到关于某些证明的大致思路。然后你就可以自由地引用同一个定理和同样的出处了。你不必必须去完整阅读你参考文献列表里的全部论文或书籍。

很多被公认已知的事情可能并没有已知的书面来源。只要该领域的人觉得这个想法行得通，它就不需要有正式的书面来源。

起初我对这个过程非常怀疑。我常怀疑某个特定想法是否真的确立了。但我发现我可以去问别人，他们能给出解释和证明，或者将我引荐给其他人，再或者给我提供解释和证明的书面来源。确实也存在那种已发表的定理普遍被认为是错误的，或者其证明普遍被认为是不完整的。

数学知识和理解嵌入在思考特定主题的社区人们的头脑中，以及该群体的社会结构中。这些知识由书面文件支持，但书面文件并不是最根本的。

我认为这种模式在不同领域之间有很大差异。我感兴趣的是数学的几何分支，在这些领域通常很难有一份能很好反映人们实际思维方式的文档。在更代数化或符号化的领域，情况不一定如此，我的印象是，在某些领域文档在承载该领域的生命力方面要紧密得多。

但在任何领域，都存在着关于有效性和真理的强大社会标准。安德鲁·怀尔斯（Andrew Wiles）对费马大定理的证明就是一个很好的例证，即便他所处的是一个非常代数化的领域。专家们在细节能够被核实很久之前，就基于高层次的思想很快开始相信他的证明基本上是正确的。与大多数数学证明相比，这个证明将受到大量的审查和核验；但无论核验过程如何进行，它都有助于说明数学是如何通过相当有机的心理学和社会学过程演进的。

当人们在做数学时，思想的流动和关于有效性的社会标准，比正式文件要可靠得多。人们通常不擅长检查证明的形式化正确性，但他们相当擅长发现证明中潜在的弱点或缺陷。

为了避免被误解，我想强调我没有在说的两件事。首先，我没有主张削弱我们社区的证明标准；我只是试图描述这个过程实际上是如何运作的。经得起审查的仔细证明非常重要。我认为证明过程在整个数学界运作得相当好。我主张的改变是，数学家们在对待他们的证明时要更加小心，使证明尽可能清晰和简单，这样如果存在任何弱点，将很容易被发现。其次，我没有批评对形式化证明的数学研究，我也没有批评那些努力使数学论证更加明确和形式化的人。这两者都是有用的活动，能为数学带来新的洞见。

在我的职业生涯的几个阶段，我投入了相当多的精力通过计算机探索数学问题。鉴于这些经验，当我看到 Jaffe 和 Quinn 声明“数学是非常缓慢和艰苦的，并且可以说它是所有人类活动中最受纪律约束的”时，我感到非常惊讶。要使一个计算机程序能运行起来，所需的正确性和完整性标准，要比数学界关于有效证明的标准高出几个数量级。尽管如此，大型计算机程序即使经过非常仔细的编写和非常仔细的测试，似乎总还是有漏洞。

我认为数学是所有人类活动中最能在智力上带来满足感的活动之一。由于我们在清晰和令人信服的思考方面拥有很高的标准，并且我们高度重视倾听和试图理解彼此，我们不会无休止地争吵，也不会无休止地返工我们的数学。我们乐于被他人说服。在智力上，数学发展得非常快。在单个人的职业生涯中，整个数学的地貌会发生令人惊叹的彻底改变并一再改变。

当你考虑到编写一个甚至在智力范畴上仅接近一篇优秀数学论文的大型计算机程序有多么困难，并且需要投入多少更多的时间和精力去使它“几乎”完全形式上正确时，再去声称我们实践中的数学几乎达到了形式化正确的程度，简直是荒谬的。

正如我们在实践中那样，相比其他科学，数学在形式上更完整、更精确，但如果与计算机程序相比，其内容在形式上却远没有那么完整和精确。差异不仅在于投入精力的数量；这种精力的种类也是本质不同的。在大型计算机程序中，有极高比例的精力必须花在无数的兼容性问题上：确保所有的定义是一致的，开发具有实用性但不繁琐的普遍性的“好”的数据结构，决定函数“正确”的通用性，等等。用在大型程序核心工作部分（而非内务处理部分）的精力比例小得惊人。由于一旦增加普遍性和功能性，“正确”的定义就会发生改变，兼容性问题几乎不可避免地会失控，这导致计算机程序经常需要重写，往往是从头开始。

如果要使数学达到形式上的正确和完整，我们将必须投入非常类似的一番努力。倒不是说在小范围内做到形式上的正确极其困难——而是说在小范围内存在许多可能的形式化选择，而在宏观上，这些选择将转化为数量庞大的相互依赖的选择。要使这些选择兼容是相当困难的；为了做到这一点，我们肯定需要回过头来，从头重写我们所依赖的所有早期数学论文。要拿出一套良好的形式定义技术选择同样极其困难，因为数学家想要以各种不同的方式使用这些定义，同时还要预期数学未来的扩展。如果我们要继续合作下去，我们的大部分时间将花在国际标准委员会上，以建立统一的定义并解决巨大的争端。

当被召唤或有动机时，数学家能够并且确实会填补空白，纠正错误，提供更多细节和更仔细的学术工作。我们的系统相当擅长产出能够获得坚实后盾的可靠定理。只是这种可靠性主要并非来自于数学家形式化地检查形式化的论证；它来源于数学家对数学思想进行的仔细和批判性的思考。

在最基础的层面上，数学的基础远比我们所做的数学本身更不稳固。大多数数学家坚持的基本原则被公认为是“客气的虚构（polite fictions）”。例如，有一个定理指出：根本不存在任何方法能够实际构造甚至定义实数集的良序（well-ordering）。有相当多的证据（但没有证明）表明，我们即便带着这些客气的虚构也能蒙混过关而不被拆穿，但这并不意味着它们就是对的。集合论者构造了许多互相替代且相互矛盾的“数学宇宙”，这样一来如果其中一个是相容的，其它的也是。这让人几乎没有信心去判断哪一个才是正确或自然的选择。哥德尔（Gödel）不完备性定理暗示，不可能存在这样一个形式系统：它既是相容的，又足够强大以作为我们所做的所有数学的基础。

与人类不同，计算机擅长执行形式化过程。有人正努力推进通过计算机实际上将部分数学形式化的项目，生成真正形式化正确的形式演绎。我认为这是一个非常庞大且非常有价值的项目，我相信我们将从中获益匪浅。这个过程将有助于简化和澄清数学。在不远的将来，我预计我们将拥有交互式的计算机程序，能够帮助人们编译大量形式化完整且正确的数学代码块（基于一些可能不稳固但至少非常明确的假设），并且它们将成为标准数学家的标准工作环境的一部分。

然而，我们应该认识到，能够被人类理解且可由人类核查的我们实际在做的证明，对我们才是最重要的，而且它们与形式化证明有着天壤之别。就目前而言，形式化证明遥不可及且多半无关紧要：我们拥有良好的人类过程来检验数学的有效性。

5. 是什么动机驱使人们做数学？

做数学有一种真正的乐趣：这是一种学习解释、组织和简化思考方式的乐趣。在发现新数学、重新发现旧数学、从某人或教科书那里学习一种思考方式、或者寻找一种新的方式来解释或看待旧的数学结构时，都能感受到这种乐趣。

这种内在的动力可能会让我们认为，我们做数学仅仅是为了数学本身。其实并非如此：社交环境极其重要。我们受到他人的启发，我们寻求他人的赞赏，我们乐于帮助他人解决他们的数学问题。我们享受的事情会因他人的反馈而改变。社交互动不仅通过面对面的会议发生，也通过书信和电子通讯、预印本和期刊文章发生。这个高度社会化的数学系统的一个结果，是数学家倾向于追逐风尚（fads）。就产出新数学定理的目的而言，这可能效率并不高：看起来我们如果让数学家更均匀地覆盖知识领域似乎会更好。但大多数数学家不喜欢孤独，除非有同僚分享他们的兴奋，否则他们很难对一个学科保持热情，哪怕他们自己明明在不断取得进展。

除了内在动力和进行数学研究的非正式社会动力之外，我们还受到经济学和地位等考量的驱动。数学家和学术界的其他人一样，做大量评判他人的工作，也被他人评判。从考试成绩开始，一直到推荐信、聘用决定、晋升决定、审稿人报告、演讲邀请、奖项……我们被卷入许多评级之中，处在一个竞争极其激烈的系统里。

Jaffe 和 Quinn 用一种许多数学家都深信不疑的通用货币：定理证明的荣誉/署名（credit for theorems），来分析做数学的动机。

我认为，我们社区对“定理荣誉”的强烈强调对数学进步产生了负面影响。如果我们成就的是在推进人类对数学的理解，那么我们就应该承认和重视范围广得多的活动。那些能看出如何证明定理的人，是在数学社区的背景下这样做的；他们并不是完全靠自己单干。他们依赖从其他数学家那里收集来的对数学的理解。一旦定理被证明，数学界就得依靠社交网络将这些想法分发给可能会进一步使用它们的人——传统的印刷媒介因为太晦涩且太繁琐而力不从心。

即便你采取一种狭隘的观点，认为我们所生产的就是定理，这个团队也是至关重要的。足球可以作为一个绝佳的隐喻。在一场足球比赛中可能只有一两个进球，由一两个人打进。但这并不意味着所有其他人的努力都是白费的。我们在评判一个球队的球员时，不仅仅看他们个人是否进球；我们把这支队伍作为一个团队的整体功能来评价。

在数学中，常常出现一群数学家带着一定数量的思想集体推进的情况。在这些进展的道路上，总有一些定理几乎不可避免地会被某个人证明。有时，这群数学家甚至能预知这些定理大概会是什么。虽然很难预测到底是谁会真正去证明这个定理（尽管总有几个更容易得分的“尖刀人物”），然而，正是由于团队的集体努力，他们才处于能够证明这些定理的位置。团队还有一个进一步的作用：在定理被证明后吸收并利用它们。就算有一个人能单枪匹马证明这条路上所有的定理，如果没人去学习它们，那也是白费功夫。

关于那些“尖刀人物”，有一个有趣的现象。在人群中间的某个人常常证明了一个被广泛认可为具有重大意义的定理。他们在社区中的地位——他们的“啄序（pecking order）”——立即并且急剧上升。当这种情况发生时，他们通常会变得更具生产力，成为思想的中心和定理的源泉。为什么？首先，他们的自尊心得到了极大增强，随之而来的是生产力的提高。其次，当他们的地位上升时，人们更处于思想网络的中心——其他人更把他们当回事。最后，也许是最重要的一点，数学上的突破通常代表着一种新的思考方式，而有效的思考方式通常可以应用于不止一种情况。

这个现象使我相信，如果我们能睁开眼睛，看到我们所做事情的真正价值，整个数学社区会变得更有生产力。Jaffe 和 Quinn 提议构建一个划分为“推测（speculation）”和“证明（proving）”的已确认角色系统。这样的划分只会固化这样一个神话：我们的进步是根据推导出的标准定理单位来衡量的。这有点像那个人打印出前 10,000 个素数的谬误。我们正在生产的是人类的理解。我们有许多不同的理解方式，以及许多促进我们理解的过程。如果我们能认识到并专注于这一点，我们将更满足、更有生产力，也会更快乐。

6. 一些个人经历

既然这篇随笔源于对我的经历与 Jaffe 和 Quinn 描述的不匹配所作的反思，我将讨论两段个人经历，包括他们暗指的那一段。

我在讲这些时确实有些尴尬，因为我对职业生涯中某些方面也有遗憾：如果带着现在对自己和数学过程的深刻认知重新来过，有很多事情我希望我能做得不同。我希望能通过如我记忆和理解的那样，相对公开地描述这些经历，帮助其他人更好地理解这个过程并提前吸取教训。

首先我要简短地谈谈叶状结构（foliations）理论。这是我最初研究的学科，从我还是个研究生时就开始了。（这里你是否知道叶状结构是什么并不重要。）

在那个时候，叶状结构成了几何拓扑学家、动力系统学者和微分几何学家关注的中心。我相当迅速地证明了一些戏剧性的定理。我证明了叶状结构的分类定理，给出了流形允许具有叶状结构的充分必要条件。我还证明了许多其他重要定理。我写了像样的论文并发表了至少是最重要的那些定理。那时我甚至很难抽出时间写下我能证明的所有东西，以至于积压了很多文章。

一个有趣的现象发生了。两三年内，该领域发生了一场戏剧性的人员撤退大撤离。我从许多数学家那里听说，他们正在给别人或自己接收这样的建议：不要进入叶状结构领域——他们说瑟斯顿（Thurston）正在清空这个领域。人们告诉我（不是抱怨，而是赞美）我正在扼杀这个领域。研究生们不再研究叶状结构了，而且不久之后，我也转向了其他兴趣。

我不认为大撤离是因为该领域的领域知识被榨干了——那里依然（并且现在依然）有许多值得尝试的有趣问题。从那时起直到现在，坚守在该领域或进入该领域的少数几个人依然取得了有趣的发展，周边领域也有一些重要发展，但我认为如果数学家们继续大力追求叶状结构理论，这些发展原本是可以被大大加速的。

今天，我认为很少有数学家能够懂任何接近那个时期最前沿叶状结构理论的东西，尽管叶状结构理论的一些部分（包括自那时以来的发展）仍然在蓬勃发展。

我相信有两种生态学效应给这门学科泼了冷水，比任何可能发生的知识资源枯竭都要严重得多。

首先，我所证明的结果（以及其他人的一些重要结果）是用传统的、令人生畏的数学家风格记录下来的。它们严重依赖于拥有特定背景和特定洞见（insights）的读者。叶状结构理论是一个年轻且充满机遇的子领域，背景尚未标准化。我毫不犹豫地调用了我从其他人那里学到的任何数学。我写的论文没有（也不可能）花太多时间解释背景文化。它们记录了顶层的推理和结论，这通常是我经过大量反思和努力才达成的。我还会扔出珍贵但晦涩难懂的见解花絮，比如“Godbillon-Vey 不变量衡量了叶状结构的螺旋摆动”，这对大多数读到它的数学家来说依然是个谜。这就制造了很高的进入壁垒：我认为许多研究生和数学家感到沮丧，因为关键定理的证明学起来和理解起来都太难了。

其次是对子领域里其他人有什么好处的问题。当我开始研究叶状结构时，我的概念是人们想要知道答案。我以为他们寻求的是一系列已被证明的强大定理，这些定理可能被应用于回答进一步的数学问题。但这只是故事的一部分。相比于知识，人们想要的是个人的理解。在我们这种荣誉驱动（credit-driven）的体系中，他们也想要并需要定理学分。

我要往后跳几年，来到 Jaffe 和 Quinn 所暗指的主题：即我开始研究三维流形及其与双曲几何的联系之时。（同样，你是否知道这是什么都不要紧。）我在很多年里逐渐建立了一种对于双曲三维流形的直觉，积累了各种构造、例子和证明。（这个过程实际上从我还是本科生时就开始了，并在其对叶状结构应用的过程中得到了极大的强化。）过了一段时间，我推测或猜想所有的三维流形都具有某种几何结构；这个猜想最终被称为几何化猜想（geometrization conjecture）。大约两三年后，我证明了哈肯（Haken）流形的几何化定理。这是一个极难的定理，我投入了巨大的精力去思考它。完成证明后，我又投入了多得多的精力去核对证明，寻找难点并对照独立的信息来检验它。

我想详细说明一下，当我说我证明了这个定理时我指的是什么。它的意思是，我有了一条清晰完整的思路之流，包括细节，经受住了我自己和他人的大量审查。数学家有许多不同的思维风格。我的风格不是做那种宽泛但草率的概括（那仅仅算是暗示或灵感）：我构建清晰的心理模型，并把事情想透彻。事实证明，我的证明相当可靠。在支持声明或为我已经证明的东西提供细节方面，我从未遇到过困难。我既善于发现自己推理中的缺陷，也善于发现他人推理中的缺陷。

然而，在将我本人思考的编码转化为能够传达给他人的内容时，有时会存在巨大的膨胀系数。我的数学教育经历相当独立且特立独行，在很多年里我都是靠自己学习，发展出关于如何思考数学的个人心理模型。在思考数学时，这对我往往是个巨大的优势，因为之后再去吸收大批数学家们共享的标准心理模型也很容易。这意味着我个人的思考中自然流畅使用的一些概念，对与我交谈的大多数数学家来说却很陌生。我个人的心理模型和结构，在特征上与数学家群体共享的那种模型相似——但它们往往是不同的模型。在提出几何化猜想时，我对双曲几何的理解就是一个很好的例子。另一个随机持续存在的例子是对有限拓扑空间的理解：这是一个古怪的话题，能为各种问题提供极好的洞见，但通常不值得在个案中专门展开，因为总有标准的迂回方法能避开它。

无论是几何化猜想，还是针对哈肯流形的证明，在当时都不在任何一组数学家的主流研究路线上——它与此前 30 年拓扑学的趋势背道而驰，让人们大吃一惊。对当时的多数拓扑学家来说，双曲几何是数学中一个隐晦的旁支，尽管也有微分几何学家等其他数学家群体能够从特定的视角去理解它。拓扑学家们花了一段时间才仅仅理解了几何化猜想究竟是什么意思、它有什么用、以及为什么它是相关的。

与此同时，结合我所教授的研究生课程，我开始撰写关于三维流形几何与拓扑的笔记。我把它分发给少数几个人，没过多久，世界各地有许多人都写信来索要复印本。邮件列表增长到了大约 1200 人，我每隔几个月就给他们发一次笔记。我试图在这些笔记里传达我真实的思想。人们根据我的笔记举办了许多讨论班，我收到了大量的反馈。绝大多数的反馈是这样的：“你的笔记真得非常鼓舞人心、非常优美，但我得告诉你，我们在讨论班里花了 3 个星期试图搞懂第 n.n 节的细节。如果能有更多的解释肯定会有很大帮助。”

我还向各种数学家群体做了许多次报告，介绍从几何视角研究三维流形的思想，以及哈肯流形几何化定理的证明。在最初，这门学科几乎对所有人都是陌生的。它很难被沟通——基础设施都在我的脑子里，而不在数学社区中。有若干种数学理论被汇聚到了这一理念群集中：三维流形拓扑、克莱因群（Kleinian groups）、动力系统、几何拓扑、李群的离散子群、叶状结构、泰希米勒空间（Teichmüller spaces）、伪 Anosov 微分同胚、几何群论，以及双曲几何。

1980年，我们在鲍登（Bowdoin）举办了一个 AMS（美国数学会）夏季研讨会，低维拓扑、动力系统和克莱因群等子领域的许多数学家都来了。

交流彼此文化是一次非常有趣的经历。一个显而易见的事实凸显出来：即证明很大程度上依赖于听众。我们在特定的社会背景下证明事物，并将它们说给特定的受众听。这段证明的某些部分我可以在两分钟内传达给拓扑学家，但分析学家则需要听上一个小时的讲座才开始能够理解。同样地，有些事情用两分钟讲给分析学家就够了，而拓扑学家却需要一个小时才能开始领会。还有该证明中很多其他的部分，在抽象状态下本应只需两分钟讲完，但当时的听众中却无人具备相应的心理基础设施能在不到一小时内搞懂它。

在那个时期，由于关于这个定理几乎毫无基础设施，也几乎没有任何语境，所以要想将一个想法在我脑中编码的方式扩展成我为了传达它而必须说出的话语（更不用提听众必须花费多少精力去理解它）时，其膨胀程度是极其戏剧化的。

作为对我早年在叶状结构上经历的反思，以及对社会压力的回应，我将我的大部分注意力集中在发展并呈现基础设施上——无论是在我所写的内容中还是在与人交谈时。我向那少数几位“准备好了”的人解释细节。我写了几篇给出哈肯流形几何化定理实质性证明部分的论文——这些论文几乎没有收到任何反馈。同样，很少有人真正啃下了我笔记里更难和更深的部分，直到很久之后。

结果是，现在相当多的数学家拥有了起初极其缺乏的东西：对这门学科那些最自然的概念和基础设施拥有有效的工作理解能力。该领域一直以来，且目前仍在持续发生着生机勃勃的数学活动。我通过专注于构建基础设施、解释和发表各类定义与思维方式，而在陈述或发表我所知如何证明的所有“定理”细节上动作缓慢，这留下了充足的空间给许多其他人来摘取荣誉（credit）。这就给人们自己去发现并发表关于几何化定理的其它证明留下了空间。这些证明有助于发展那些本身就十分有趣的数学概念，并能引向更远处的数学。

数学家们最想也最需要从我这里学到的，是学习我的思维方式，而非真的去弄清楚我对哈肯流形几何化猜想的证明细节。一般性的几何化猜想的证明，不太可能是通过把同样的证明再强行往前推演而构成的。

另一个问题是，人们有时需要或想要一个被接受并被验证过的结果，其目的不是去学习它，而是能够引用它并依赖它。

事实上，数学家们非常快地就接受了我的证明，并开始根据当时仅有的文字材料、根据他们自己的经验和对我的信任、并且根据与我花费了大量时间交流证明的各方专家的意见，开始引用并使用它。现在这个定理已经被记录下来，通过由我及他人撰写的已发表来源作为背书，所以大多数人在引用它时感到安全；在该领域内部，绝对没有人对我发出过关于它有效性的挑战，也没有人向我表达过需要获取并未公开细节的诉求。

在我们为数学建造的逻辑脚手架中，并非所有的证明都具有完全相同的作用。这个特别的证明也许仅仅具有暂时性的逻辑价值，尽管在帮助支持关于三维流形结构的某种愿景上，它有着极高的动机刺激价值。完整的几何化猜想仍然是一个猜想。它已经在许多情况下被证明，并得到了大量计算机证据的支持，但尚未在一般意义上被证明。我深信其一般的证明将会被发现；我希望不要再等太多几年。到了那个时候，那些特例的证明很有可能会变得过时。

与此同时，那些想使用这套几何技术的人，如果从假设“令 $M^3$ 为一个允许几何分解的流形”开始出发会更好，因为这比“令 $M^3$ 为一个哈肯流形”更加具有普遍性。那些不想使用该技术或对此持怀疑态度的人可以避开它。即使关于哈肯流形的一个定理能用几何技术证明，如果能找到纯拓扑技术来证明它，仍然具有极高的价值。

在这段插曲（并且仍在继续）中，我认为我成功避免了最糟糕的两种结果：要么我自己不吭声，不让人知道我发现并证明了什么，把一切捂在自己手里（可能是希望凭一己之力证明庞加莱猜想）；要么抛出一个无懈可击却又晦涩难懂的理论，而完全没有实践者来保持它的生命力并使其生长。

我能轻而易举地说出我职业生涯中的遗憾。我没有发表出我本该发表那么多的文章。除了哈肯流形的几何化定理之外，我还有若干数学项目没能很好地（甚至根本未能）传递给数学公众。当我更多地专注于开发三维流形几何理论的基础设施，而不是最高层的定理时，随着这个学科继续发展，我变得有些脱节；同时我也没有主动或有效地去推动该领域的发展或其中那些卓越人才的职业生涯。（但这种某种程度上的“脱节”，对我来说似乎是指导研究生和其他人所不可避免的副产品：为了把真正的研究方向交给他人，你必须真正放手，并阻止自己再对它们进行太过深入的思考。）

另一方面，我一直十分忙碌并多产，涉及许多不同的活动。我们的体制没有为像我这样的人创造额外的时间花在写作和研究上；相反，它用大量的请求和参与额外工作的机会淹没了我们，而我的直觉反应总是对许多这类请求和机会说“好的”。我将大量的精力投入到了没有“学分”产出的活动中，但我同样看重这些就如同我看重证明定理一样：参与数学政治、把我的笔记修改成具有高交流标准出版的书、探索数学计算、投身数学教育、通过“几何中心”（Geometry Center）开发用来交流数学的新形式（例如我们的首次实验项目，《Not Knot》视频）、担任 MSRI（美国国家数学科学研究所）所长，等等。

我认为我所做的一切可能并没有将我的“学分（credits）”最大化。但我所处的位置使我不再感到有强烈竞争获取更多学分的需要。相反，我在证明新定理之外的其他事情中，开始感受到了强烈的挑战。

我确实认为我的行动在激发数学的活力方面做得很好。