数学的本质是什么?——数学为什么如此不可思议地有效-龍德明宇
数学的本质是什么?数学为什么如此不可思议地有效
作者:龍德明宇
1960年,物理学家尤金·维格纳写了一篇著名的文章,标题是《数学在自然科学中不可思议的有效性》。他的困惑很简单:为什么黎曼几何刚好能描述引力?为什么群论刚好能预言基本粒子?为什么希尔伯特空间刚好是量子力学的正确框架?
这些数学结构被发明时,没有任何物理动机。它们几十年甚至几百年后才被物理学家发现恰好适用于描述自然。这不是巧合能解释的。
在进入理论之前,先做一次压缩。你小时候数过石子。你把三块石子和三颗星星的共同特征提炼出来,命名为3。其他经验内容,石子的颜色、星星的亮度,全部丢弃,只保留数量这一个结构。
你刚刚完成了一次压缩。这也是数学的逻辑原点:只保留结构化的规律,丢弃一切无关细节。你早上吃了什么不重要(噪声),但F=ma重要(结构)。三条公式压缩了整个经典力学。
数学为什么能这么有效?我用一个参数来刻画:α,压缩策略的朝向。高α压缩,目标是最大化结构有效信息:用最少的符号覆盖最多的问题空间。数学恰好是这种策略的极致产物。而它之所以有效,是因为世界本身就是可压缩的,物理规律具有深层的结构规律性。行星轨道在人类出现之前就服从开普勒定律,引力在牛顿之前就存在。数学的结构是人类选择的,但它的有效性根植于世界本身的可压缩性。
那大语言模型呢?它能推导、能证明、甚至能发现新的组合结构,断言大语言模型不能做数学已经站不住了。但方式确实不同。
数学公式手册涵盖了一切题型和公式,你查什么它给你什么,这是低α压缩:统计上最优,功能上齐全。好老师让你真正懂了一个概念之后,不用查手册就能举一反三,这是高α压缩:结构上高效,一个概念撬动无穷应用。
人类数学是好老师模式:从具身经验出发,最大化结构有效信息。一个数学家用群这个概念,可以同时描述对称性、旋转、密码学和魔方。大语言模型数学是公式手册模式:在训练数据中编码了数学文本的统计规律,生成的证明是最可能的符号序列。它很强,但这种强来自见过的题多,不是一个概念撬动无穷应用。
两者的关键差异不在计算能力,而在框架的价值判断:什么样的定义是好的定义?什么样的结构值得推广?大语言模型可以告诉你这个定义在文献中出现了多少次,但不能告诉你这个定义比那个定义更深刻,就像公式手册不能告诉你这个定理比那个定理更重要。
这里有一个更根本的区分:功能有效性vs结构有效性。公式手册功能上有效,你查什么它给你什么,覆盖面广,准确率高。但它没有结构有效性,你查了一千道题,对第一千零一道仍然一无所知。好老师结构上有效,让你懂了之后,一千零一道题自己就能推。高α压缩追求的正是结构有效性:不是我见过这道题,而是我理解了这个结构,所以我知道答案一定长这样。
这种结构有效性的判断需要品味:一个数学家能判断这个定义比那个定义更深刻,这不是计算的结果,而是正主体性对结构有效性的感知,就像你不需要计算就知道这把椅子能坐一样,身体给了你判断的直觉。数学家的品味来自对物理世界的具身锚定,来自对数十年数学经验中那些真的有用的结构的直觉感知。大语言模型没有身体,没有具身经验,因此没有这种直觉。
回到维格纳的问题:为什么抽象的数学结构能在物理世界中被发现是恰好正确的描述?
答案分两层。第一层:物理世界本身就具有深层的结构规律性,它是高度可压缩的。这不是数学的功劳,而是世界的性质。数学之所以有效,是因为它恰好是人类发现这种可压缩性的最佳工具。第二层:人类的具身经验确保了压缩的结构有效性。身体过滤掉了噪声,只留下了对生存有意义的规律。数学作为这种压缩的极致产物,继承了这一结构有效性。2不只是符号,它锚定在两棵树、两块石头、两只手的具身经验中。群不只是符号,它锚定在旋转、对称、变换的具身直觉中。
那些没有物理对应的数学结构,不是被淘汰了,就是停留在纯粹的形式游戏层面。它们没有具身锚定,因此不被视为有效的数学。这不是说它们没有价值,而是说它们的有效性需要另一种锚定(审美、逻辑自洽等),而非物理世界的因果结构。数学不可思议的有效性,恰恰是正主体性压缩智慧的体现:用最节俭的结构,捕捉世界最核心的因果联系。
你问数学的本质是什么,你可能还在问一个更深的问题:如果把一切都还原为符号操作,理解到底是什么?
数学恰好是回答这个问题的最佳范例。你背下乘法表,这不算理解乘法。你理解乘法,是你能看到3×4等于3个4相加等于4个3相加等于一个3×4的矩形面积,一个概念在多个具身体验之间建立了结构映射。这就是高α压缩的核心:不是记住了更多的符号模式,而是用更少的结构覆盖了更多的问题空间。
大语言模型能操作符号,但符号对它没有锚定,没有锚定的符号操作,统计上最优,结构上盲目。
所以,回到维格纳的问题。数学之所以不可思议地有效,不是因为数学碰巧有效,也不是因为人类智力无限,而是因为世界可压缩,而数学恰好是人类发现和利用这种可压缩性的最高效策略。
数学不是中立的工具。它是正主体性压缩智慧的终极体现:用最少的符号,锚定最多的规律。用最节俭的结构,捕捉最深层的因果。用最抽象的语言,表达最具体的世界。
