跳至正文

数学证明是什么:从直觉到严格的漫长旅程

🟣 数学严格 · 📅 2026年3月 · ⏱ 阅读约15分钟

当物理学家写下薛定谔方程,当相对论预言了时空弯曲,支撑这一切的底层是什么?是实验,是观测,是直觉——但在这些之前,还有一种更古老、更奇特的认知方式:数学证明。它不依赖测量,不依赖经验,却能得出被全人类公认的确定性结论。但这到底是怎么做到的?所谓”证明”,究竟是一串冷冰冰的符号推导,还是某种更丰富、更活生生的思维活动?

这个问题比表面看起来深得多。过去半个世纪,数学哲学家、逻辑学家、人工智能研究者从三个完全不同的方向向它逼近——他们的答案彼此交织,揭示出数学证明惊人的多层结构。理解这一点,也许能帮助我们更好地理解:为什么量子力学的数学框架如此令人信服,为什么不确定性原理不是一种模糊表述,而是严格不等式;以及为什么广义相对论的场方程,从一组公设出发,能对宇宙的形状作出精确预言。

📑 本文目录

证明是什么?三种答案

问一个数学系学生”什么是证明”,他大概会说:从公理出发,依照推理规则,一步步推出目标命题。这个答案没错,但它只触及冰山一角。

在数学哲学领域,至少存在三种分歧相当大的答案:

  • 形式主义答案:证明是一个有限的符号序列,其中每一行要么是公理,要么由前面的行通过推理规则推出。这个定义机器可以检查,人人可以验证。
  • 实践主义答案:证明是数学共同体中用于产生”可理解的确信”的论证。它的标准不是机械可验证性,而是能否令同行信服并理解。
  • 动态主义答案:证明是数学发现过程的一部分,它不只证明命题,还会改造概念、塑造对象、推动定义修订。[3]

这三种答案不是互斥的,它们各自照亮了证明的不同侧面。理解它们之间的张力,正是理解”数学证明是什么”的核心。

从欧几里得开始:最古老的证明不是你想的那样

公元前300年,欧几里得写下《几何原本》。这本书通常被引为”公理化证明”的起点:5条公设,若干定义,然后一切定理从中推出。这幅图景深入人心,以至于”欧几里得式严格”几乎成了数学严密性的代名词。

但这幅图景是后人的美化。

2019年,Michael Beeson用接近欧几里得原始公设的公理体系,尝试对《几何原本》第一卷进行计算机证明核查。结果令人吃惊:若要把欧几里得的文本变成现代可机器核验的证明,必须补入大量隐含引理、图形信息和被欧几里得视为”显然”而跳过的推理步骤。[9][20] 用人话说:欧几里得的证明依赖图形直觉,依赖共同体的默契,而不是纯符号推导。

更有趣的是,欧几里得的第四公设——”所有直角都相等”——其历史地位本身就充满争议。2022年的历史研究表明,古希腊几何中”公理”与”可被证明的命题”之间的边界并非像现代教科书所呈现的那样固定清晰。[10] 所谓”公理”,是历史和共同体协商的产物,而非天然给定。

2024年,研究者又尝试让大语言模型结合定理证明器,把欧几里得文本自动转成可在 Lean 中验证的形式对象。他们发现,图形依赖和文本省略依然是最难克服的障碍。[11] 两千三百年过去了,欧几里得留下的那个谜题——人类的直觉与机器的严格之间的鸿沟——依然没有彻底弥合。

这个历史教训的意义在于:证明从一开始就生活在语言、图形与符号的交界地带。”纯粹形式的证明”,在数学历史的大部分时间里,并不存在。

🧪 思想实验:完全形式化一个”显然”的证明要多少步?

考虑欧几里得第一卷命题1:在给定线段上作等边三角形。欧几里得的证明只有几行:分别以线段两端点为圆心、线段为半径作两个圆,取交点,连线即得。论证似乎无懈可击。

但如果你问:两个圆一定相交吗?欧几里得从未证明这一点。他依赖的是图形直觉——两个圆在图上明显是相交的。然而在纯粹公理系统里,”交点存在”需要额外的连续性公理(Pasch公理或等价物),这是欧几里得五条公设之外的东西。

Beeson的计算机核查工作表明,补齐这类”显然”步骤,是将古典证明转化为现代可验证形式的主要工作量所在。[9] 这意味着:我们日常理解的”严格证明”,其实默默依赖了大量未言明的前提。一旦让机器来检查,这些前提就无处遁形。

思想实验的结论:如果连欧几里得这个”公理化数学”的始祖都在无意中依赖直觉,那么真正”完全形式化”的证明究竟意味着什么?

证明的五种功能:不只是”判真”

为什么数学家在一个定理被证明之后,还要继续寻找它的新证明?如果证明只是”判定命题是否为真的工具”,那么第一个成功的证明之后,后续的证明就没有意义了。但事实上,数学史上许多重要定理都被反复重证,有时多达数十次。[4]

这说明证明承担的功能远不止于验真。数学教育与哲学文献将证明的功能梳理为至少五个维度[6]

  1. 验证(Verification):确认命题为真。这是最基本的功能,也是大众最熟悉的那个。
  2. 解释(Explanation):揭示”为什么”真,而非只是”是否”真。一个好的证明应当让人产生”啊,原来如此”的顿悟感。[5]
  3. 发现(Discovery):证明过程常常揭示新的对象、新的联系,甚至推翻原有定义。Lakatos的经典分析表明,证明与反例的对话会逐步塑造数学概念本身。[3]
  4. 系统化(Systematization):证明把分散的命题组织成有层次的知识结构,让数学可以被传授、检索与继承。
  5. 交流(Communication):证明是数学家之间传递思想的语言。一个可读的证明,是认知上的礼物。

Hanna 在一篇颇具影响力的综述中区分了两类证明:令人信服的证明(proof that convinces)与令人理解的证明(proof that explains)。[5] 前者只需让你接受结论,后者还要让你明白结构。两者有时重合,有时相去甚远——许多计算机辅助证明属于前者,但对大多数人来说,它们几乎无法提供任何解释性理解。

这个区分对物理学同样意味深长。量子力学的数学框架(波函数的诠释)至今争议不断,不是因为公式不够严格,而是因为我们还没有一个令人满意的解释性证明——一个让人真正理解”为什么量子力学是这个样子”的论证。

此外,Rav 在1999年的经典论文中进一步指出:证明不只是定理的附属品,证明本身就是数学知识的载体。[1] 概念间的联系、方法的可迁移性、结构洞见——这些都储存在证明里,而不是在定理的命题陈述中。这就是为什么删掉证明只保留结论的数学,是残缺的数学。

形式证明与自然证明:两层结构,一个真相

现在可以面对那个根本性的张力了:日常数学实践中的证明,与形式逻辑系统中的证明,是同一种东西吗?

Carl 在2019年的现象学分析中给出了一个清晰的答案:不是,但也不是两个无关的东西。[8] 自然证明(natural proof)——数学家写在论文里、在讲台上演讲的那种——强调人类可读性、可理解性、可追踪性,它的”步骤”是认知上的跨越,而非逻辑上的最小单元。形式证明(formal proof)——能被 Coq、HOL Light、Lean 或 Metamath 接受的那种——强调机器可核验性,每一步都明确合法,但往往需要数千行来描述数学家寥寥几行就能说清楚的事情。

这两种证明不是”哪个更好”的问题,而是两种不同的认知层次,各有其不可替代的价值。Rav 在2007年进一步批评了把数学家证明实践完全还原为形式化的倾向,指出大量数学推理依赖语义和意义,无法被符号规约完整捕捉。[2]

Witzel 等人开发的 Prove-It 系统,把设计目标明确设为”让形式证明尽可能接近自然证明”,提供 LaTeX 渲染与 Jupyter 界面。[15] 这个选择本身就说明了问题:如果形式证明天然易读,就没有必要专门做这种设计。正因为两者存在鸿沟,才需要专门的桥梁工程。

那么,这道鸿沟究竟有多大?

Wittmann 在2021年直接追问”何时一个论证算证明”,试图为”满足共同体可接受的严格性标准”划定边界。[7] 他的结论是:这个标准是历史的、语境的,随着工具与共同体的演化而演化。两千年前欧几里得式的论证算证明;二十世纪初只要无矛盾就算证明;今天,在某些领域,不被计算机核查的证明越来越难以获得信任。

这也意味着:什么算”证明”,本身就是一个开放的哲学问题,而不是一劳永逸被定义好的事。

当机器开始证明:技术如何重新定义”证明”

过去三十年,一场悄然的革命正在改变”证明”这个词的含义。

故事从交互式证明助手开始。Coq、HOL Light、Lean 这类系统,要求证明者把每一个推理步骤表达为系统可检查的”tactics”序列。2019年,Yang 和 Deng 把定理证明建模为与证明助手的交互过程,用机器学习系统在 Coq 环境中生成证明动作序列——证明在这里变成了”状态空间中的可验证搜索轨迹”。[12]

2020年,Polu 和 Sutskever 的 GPT-f 在 Metamath 形式库上生成了新的可接受证明。[13] 这意味着:一旦”证明”被定义为机器可核验的对象,它就可以被生成、筛选、提交和归档——就像软件代码一样。

但真正有趣的发展,是研究者发现自然证明与形式证明之间并非断裂,而是可桥接的层级。2023年的 Draft, Sketch, and Prove 工作表明,利用非形式证明草稿来引导形式证明搜索,能显著提升成功率。[14] 人话翻译:先让人类数学家写出”思路梗概”,再让机器把梗概填充成可检验的完整证明。两者协作,比各自单独行动都更有效。

更早的工作也表明,机器证明并不是大语言模型时代才出现的新鲜事物。2016年,进化算法就已经与证明助手结合,把定理证明问题视为可搜索、可优化的对象。[18] 这条技术线索延续了数十年,而大语言模型的出现只是最近的加速节点。2024年的综述对这一领域做了全面梳理:自动形式化、前提选择、证明步骤生成、证明搜索——现代技术把”证明”这个单一概念拆解为多个可计算的子任务。[16]

机器还告诉我们另一件事:证明有质量维度。Kinyon 在2018年讨论了”证明简化”问题——自动系统生成的证明往往冗长、低效,而一个更简洁的证明不只是审美上的优越,更意味着更强的可理解性与可复用性。[19] 证明不是有/无的二元变量;它有好坏、长短、深浅。

今天,证明越来越像人机协作的产物。HOL4 的证明推荐系统可以向用户推荐下一步应该尝试哪条引理或战术。[17] 人设定目标,系统提供路径候选,人做最终判断——这是一种新型的认知协作模式,与两千年前欧几里得独自书写的方式截然不同,但本质上都在回答同一个问题:这个结论,是否真的必然成立?

桥梁:数学证明与物理世界

绕了这么远,我们回到起点:为什么数学证明对理解物理世界如此重要?

答案是:物理理论的”严格性”,最终依赖数学证明给出的那种确定性。当我们说广义相对论预言了引力波,我们是说:在特定公设(等效原理、微分几何框架、爱因斯坦场方程)下,引力波的存在是被证明的,而不是被”猜到的”或”拟合出来的”。数学证明提供的,是一种与实验证据性质不同的必然性——只要前提成立,结论无法不成立。

但这里有一个深刻的哲学疑问:数学证明所保证的必然性,是世界的必然性,还是推理游戏的必然性?欧几里得几何被证明是内在一致的,但它不是宇宙几何的真实形状——非欧几何的发现颠覆了这一点。证明可以保证逻辑内部的无矛盾,但无法保证公理与现实的对应。

这正是数学证明最令人着迷的地方:它在两个世界之间搭桥,却永远无法替代其中任何一个。它不能替代实验(无法告诉你哪组公理对应现实),也不能被实验替代(无数次实验观测无法等同于一次证明)。数学证明与物理实验,是两种完全不同的认知方式,各自产出不同质地的知识。

而当两者相遇——当一个物理理论既通过了严格数学证明,又通过了实验检验——那种双重确认所带来的认识论快感,正是现代科学最深的满足之一。不确定性原理就是这样一个例子:它既是希尔伯特空间中可严格证明的定理(Robertson不等式),也是被无数实验反复证实的自然规律。数学与现实,在这里奇迹般地汇合。


🟣 核心要点

  • 证明不只是”判真器”:它同时承担验证、解释、发现、系统化、交流五种功能。[6]
  • 欧几里得的证明依赖图形直觉:计算机核查显示,补齐隐含步骤是将古典证明形式化的主要工作。[9]
  • 自然证明与形式证明是两个互补层次:前者面向人类理解,后者面向机器核验,两者可以桥接但不能相互替代。[8][14]
  • 证明有质量维度:不只是有或没有,还有简洁性、解释性、可迁移性之分。[19]
  • 什么算”证明”是历史演化的:从欧几里得到计算机辅助核查,标准随工具与共同体共同演化。[7]
  • 数学证明的必然性不等于物理真实性:证明保证逻辑内部的无矛盾,但无法保证公理与现实的对应。

参考文献

  1. Rav Y. Why Do We Prove Theorems? Philosophia Mathematica. 1999. DOI: 10.1093/philmat/7.1.5
  2. Rav Y. A Critique of a Formalist-Mechanist Version of the Justification of Arguments in Mathematicians’ Proof Practices. Philosophia Mathematica. 2007. DOI: 10.1093/philmat/nkm023
  3. Lakatos I. What does a mathematical proof prove? In: Mathematics, Science and Epistemology. 1978. DOI: 10.1017/CBO9780511624926.005
  4. Dawson JW. Why Do Mathematicians Re-prove Theorems? Philosophia Mathematica. 2006. DOI: 10.1093/philmat/nkl009
  5. Hanna G. Proof, Explanation and Exploration: An Overview. Educational Studies in Mathematics. 2000. DOI: 10.1023/A:1012737223465
  6. Hanna G, de Villiers M. Aspects of Proof in Mathematics Education. In: Proof and Proving in Mathematics Education. 2012. DOI: 10.1007/978-94-007-2129-6_1
  7. Wittmann EC. When Is a Proof a Proof? 2021. DOI: 10.1007/978-3-030-61570-3_5
  8. Carl M. Formal and Natural Proof: A Phenomenological Approach. In: Proof Technology in Mathematics Research and Teaching. 2019. DOI: 10.1007/978-3-030-15655-8_14
  9. Beeson M. Proof-checking Euclid. Annals of Mathematics and Artificial Intelligence. 2019. DOI: 10.1007/s10472-018-9606-x
  10. De Risi V. Euclid’s Fourth Postulate: Its authenticity and significance for the foundations of Greek mathematics. Science in Context. 2022. DOI: 10.1017/S0269889723000145
  11. Murphy LR, Alokshiya M, Naliya K, et al. Autoformalizing Euclidean Geometry. 2024. arXiv: 2405.17216
  12. Yang K, Deng J. Learning to Prove Theorems via Interacting with Proof Assistants. 2019. arXiv: 1905.09381
  13. Polu S, Sutskever I. Generative Language Modeling for Automated Theorem Proving. 2020. arXiv: 2009.03393
  14. Jiang AQ, Li W, Jamnik M, et al. Draft, Sketch, and Prove: Guiding Formal Theorem Provers with Informal Proofs. 2023. arXiv: 2210.12283
  15. Witzel W, et al. Prove-It: A Proof Assistant for Organizing and Verifying General Mathematical Knowledge. 2020. arXiv: 2012.10987
  16. Li Z, Cao Y, Wang L, et al. A Survey on Deep Learning for Theorem Proving. 2024. arXiv: 2404.09939
  17. Dekhil N, et al. Proof Recommendation System for the HOL4 Theorem Prover. 2024. arXiv: 2501.05463
  18. Yang L-A, et al. Automatically Proving Mathematical Theorems with Evolutionary Algorithms and Proof Assistants. 2016. DOI: 10.1109/CEC.2016.7744352
  19. Kinyon M. Proof Simplification and Automated Theorem Proving. Philosophical Transactions of the Royal Society A. 2018. DOI: 10.1098/rsta.2018.0034
  20. Beeson M. Euclid after Computer Proof-Checking. The American Mathematical Monthly. 2022. DOI: 10.1080/00029890.2022.2069985