2025-03-26

陶哲轩:机器辅助证明与数学的未来

摘要

陶哲轩在本次演讲中系统回顾了机器在数学研究中的历史角色——从算盘、制表到科学计算和SAT求解器,并重点介绍了三种正在改变数学研究范式的新工具:机器学习(发现数据中隐藏模式)、大语言模型(辅助编码与文献检索等次要任务)和形式化证明助手(严格验证证明并支撑大规模协作)。他认为这些工具尚未产生"杀手级应用",但三者的融合将是未来突破的关键方向。

内容框架与概述

演讲以"数学正处于剧烈变革时代"为引子开篇,指出数学作为极其传统的学科,合作规模长期停留在三到五人,但机器的介入正在打破这一局面。陶哲轩首先梳理了机器在数学中的悠久历史:从古代算盘和中世纪三角函数表,到实验数学传统(如高斯对素数的研究、BSD猜想的发现),再到OEIS数据库、科学计算和SAT求解器等工具,说明机器辅助数学并非新鲜事,但其规模和性质正在发生质变。

演讲的核心部分围绕三种新兴工具展开。在形式化证明方面,他通过四色定理(从1970年代到2005年才完成形式化)和开普勒猜想(历时11年形式化)两个经典案例,对比了多项式Freiman-Ruzsa猜想仅用3周、20人即完成形式化的现代速度,展示了技术进步带来的巨大飞跃。在机器学习方面,他以纽结理论为例,说明神经网络如何帮助发现组合不变量与几何不变量之间的隐藏关系,并引导人类提出和修正猜想。在大语言模型方面,他坦陈LLM直接做数学计算并不可靠,但让其生成代码再执行是更有效的路径,AI数学奥林匹克竞赛的进展也佐证了这一点。

演讲最后展望未来,提出语义搜索、形式化辅助和数据库建设等方向,强调数学家需要调整工作流程、接受工具的失败率,并指出AI有望革新数学教学方式。问答环节涉及数据匮乏领域的机器学习应用、形式化困难命题的特征,以及范畴论等高层次语言在证明助手中的潜力等开放性问题。

核心概念及解读

形式化证明助手:一种严格的计算机语言证明检查器(如Lean、Coq),能逐行验证数学证明的每一步并生成证明证书。其关键价值在于突破了数学协作的信任瓶颈——参与者无需相互信任,因为每一步都由机器验证,从而使大规模众包式数学协作成为可能。

机器学习驱动的猜想发现:利用神经网络从大规模数学数据中识别人类难以察觉的模式。纽结理论案例中,神经网络不仅发现了组合不变量与几何不变量的关联,还通过对网络的反向分析帮助研究者锁定关键变量、修正猜想并最终完成证明,体现了人机协作的理想范式。

LLM的代码生成策略:大语言模型直接进行数学计算容易出错,但将其角色转变为"代码生成器"——让LLM编写Python等程序再由计算机执行——则显著提升了可靠性。这一策略已在矩阵乘法算法改进和AI数学奥林匹克竞赛中得到验证。

“杀手级应用"尚未到来:陶哲轩将当前阶段比喻为"互联网已发明但电子邮件尚未出现"的时期。机器学习、LLM和形式化证明各自有用但彼此交互不足,真正的变革将来自三者的深度融合,而这需要数学家主动改变研究工作流程来适应。

众包形式化证明:将复杂证明分解为大量小引理,分配给众多贡献者分别形式化,由证明助手自动验证整合。多项式Freiman-Ruzsa猜想项目(20人、3周完成)和费马大定理形式化项目(5年计划)代表了这一模式从实验到规模化的演进。


原文信息

字段内容
原文讲座-陶哲轩@SimonsFoundation机器辅助证明:数学的未来
作者
发表日期2025-03-26

此摘要卡片由 AI 自动生成