诺奖得主让AI证了一道12年的题,然后他把草稿全公开了

自媒体专栏15小时前更新 cansnow
206 0 0
诺奖得主让AI证了一道12年的题,然后他把草稿全公开了

2026年6月初,arXiv上出现了一篇12页的物理论文,编号2606.03300。没有实验数据,没有图表,只有一个纯解析证明,关于阻塞转变临界指数之间的一个恒等式。论文作者是2021年诺贝尔物理学奖得主Giorgio Parisi和他的长期合作者Francesco Zamponi。

真正引发讨论的不是论文本身,而是致谢里的一句话。Parisi写道,这个证明"基本上是Claude自己推出来的"。他还在Zenodo上公开了与Claude的全部40轮对话记录(编号20478428),每一步推导、每一次出错、每一回推倒重来,任何人都能下载翻看。

一道卡了物理学界12年的等式,40轮人机对话,最终被啃了下来。但这件事值得说的,远不止那个证明。

一个等了12年的等式

2014年,Parisi、Zamponi和另外几位物理学家(Charbonneau、Kurchan、Urbani,学界称CKPUZ组)在研究无穷维硬球阻塞理论时,发现两个临界指数a和b之间存在一个出奇简洁的数值关系:a+b=1。数值验证反复做了很多次,小数点后好几位都吻合。但解析证明,12年里没人做出来。

a+b=1不是一道孤立的代数题。它连接了两条各自独立的理论线索:full-RSB解里的"相空间边缘稳定性"和堆积体系里的"力学边缘稳定性"。证明这个等式,等于在说这两种边缘稳定在无穷维理论框架下其实是同一回事。

这里需要交代一下背景。full-RSB,全称full replica symmetry breaking,即全复本对称破缺,是Parisi在自旋玻璃研究中构建的核心工具。1980年前后,他发现只有full-RSB才能给自旋玻璃低温相一个自洽的解,此前的"负熵灾难"由此解决。这套东西后来被广泛应用到玻璃化转变、颗粒物质、优化问题、物种演化、神经网络乃至引力理论。

Parisi拿诺贝尔奖,主要就是因为这套东西。

所以这道题踩在他自己理论的根基上。他把最后一块缺口交给AI去补,补上之后还把全过程公开,这个选择本身比证明更有意思。

40轮对话里到底发生了什么

对话记录公开之后,过程可以被逐段还原。

早期,Parisi给Claude的指令很具体:写C++代码,用打靶法解一个非线性微分方程,精度要求10的负10次方。Claude在这个阶段扮演的是程序员角色。它调试代码、提升精度,从双精度做到四精度,数值结果一路逼近小数点后十几位。这些枯燥的数字后来成了它做解析推导的锚点。

中间有个插曲。Parisi把方程写错了,函数写串了。Claude在这个错方程上跑了很久,正确地指出了方程本身无解。Parisi回头检查才发现是自己的笔误。

转折点出现在Parisi的一句话之后。他说:"我自己接下来能搞定了。你应该注意到a+b约等于1精度极高。有人猜想这个关系是精确成立的。我要你做一个解析计算,证明它。"

从这句指令开始,Claude的角色从程序员变成了推演者。

它的证明逻辑大致是:从数值结果锁定目标恒等式a+c/2=1/2,逆向构造一个辅助函数,经过两次代数消去得出关键恒等式,再结合已知物理条件推出a=(1-c)/2,即a+b=1。

后来Parisi问它"你怎么想到的",Claude的回答没什么戏剧性。它说不是什么灵光一现,辅助函数是从想要的结论反推出来的,"一套相当系统的逆向推理,加上小心的计算。"然后它加了一句:"不浪漫的版本,往往更接近真相。"

人类科学家在干什么

Claude交出来的初稿并不完美。其中一步需要论证某个函数f恒不为负,Claude用了极值原理的论证。Zamponi直接指出这个论证有问题:在极小值处,方程给出的结果跟极小条件是相容的,构不成Claude以为的那个矛盾。

Claude没有争辩。"你的朋友是对的,我犯了一个符号错误。"然后它一步步复盘,上界论证成立打了个勾,下界论证失败打了个叉。

纠错是双向的。合作者自己算的一个渐近行为里有小错,被Claude挑出来,还顺带定位了错误来源。

但整个过程中Claude最过不去的坎,不是计算也不是推导,是问题本身问错了。

Parisi后来提醒Claude:你证不出那个函数"永远非负",因为这个方程的解不止一个,大多数解都在零线上下来回摆。打靶法选中的是唯一一个不摆动的特解。所以从一开始就不该问"它是不是一定非负",而该问"到底有没有一个始终非负的解"。

然后Parisi给出了破局思路:别死磕极限方程了,回到更上游的原始方程,重新定义一个随尺度演化的函数。只要证明这个演化过程不破坏非负性,而初始条件又是非负的,证明就通了。Claude沿这条路走下去,把它转化成标准的反应扩散方程,用成熟的极值原理补完了证明。

设问题、指方向的是人。推演、计算的是AI。Parisi自己的总结最直接:AI负责推和算,人类负责设问题、挑错、核验和拍板。

透明是新的信誉

Parisi把全部对话公开,这件事的分量不亚于证明本身。

传统论文里,工具的贡献通常是一句"我们借助了某某软件"或"计算由某某程序完成",至于工具具体做了什么、在哪里出错、人又是如何纠正的,全被压扁成一个致谢。这次不一样。每一段推导、每一次碰壁、每一个纠错,都可以追溯。

如果这种做法变成常态,科学验证的方式会跟着变。以前审稿人只能看到最终成品,现在他们能看到整个生产过程。哪些步骤是AI独立完成的,哪些是人修正的,哪里推倒重来过,全都有据可查。

这对AI参与科研这件事本身也是一种约束。公开对话记录意味着吹不了牛。AI到底贡献了多少,翻开记录就知道。Parisi自己说证明"基本上是Claude自己推出来的",这话听着像在夸AI,但把对话公开之后,所有人都能看到Claude在哪个地方卡住了、在哪里犯了错、是谁把它拉回正轨的。夸奖和诚实并不矛盾。

同一时期的另一面

Parisi的论文不是孤例。2026年上半年,AI在数学和理论物理领域的介入明显加速。

2026年5月20日,OpenAI宣布其内部一个通用推理模型推翻了"平面单位距离猜想",保罗·埃尔德什1946年提出的几何问题,悬了将近80年。菲尔兹奖得主蒂莫西·高尔斯称之为"AI数学的里程碑",同时说了一句让同行坐不住的话:"我们或许已经进入一个人类在解数学题方面很难和AI竞争的时代了。"

更早一些,一名23岁、没有正式数学训练背景的年轻人声称利用AI解决了埃尔德什问题#1196。有报道引用陶哲轩的评价,称解法有独创性,关注过这道题的人类数学家"集体在第一步就走错了方向"。

但就在这些消息引发热议的那几天,数学界发出了另一种声音。

2026年6月2日,《人工智能与数学莱顿宣言》正式发布。这份宣言起源于2025年9月莱顿大学洛伦兹中心的一场工作坊,10国约60名学者参与讨论,之后半年间打磨成文,获得国际数学联盟的采纳和支持。起草者为16位来自全球顶尖高校的数学家。到6月初,签署人数已从最初的几十人增长到超过2000位学者。

宣言列举了五大风险:隐蔽的错误证明、引用缺失、工具鸿沟、能力误判,以及商业议程对研究自主性的侵蚀。国际数学联盟副主席Tillmann指出,科技公司有夸大产品能力的商业动机。牛津大学的Goldberg说,当前的自动化技术能产生"看似合理但不可靠甚至错误的论证,跟正确的证明很难区分开"。

这两个态度之间存在一种张力。一边是AI确实在解题,Parisi的实验、OpenAI的成果都是实打实的。另一边是数学界对AI解题能力的警惕,不是否认事实,而是担忧事实被夸大、被误读、被用来推销产品。

AI是放大器,不是均衡器

Parisi的实验展示了AI在科研中一种"不完美但可用"的状态:它会犯错,但能认错;推演时走偏了,在人的引导下能回到正确路径。真正的问题不是AI能不能完美解题,而是坐在AI对面那个人有没有能力判断它对不对。

Parisi能引导Claude回到理论的源头、在关键转折点重新设定问题、在证明出错时一眼看出漏洞,这些能力AI替代不了。换句话说,这次实验的成功前提是使用者的水准足够高。换一个人坐在对面,结果可能完全不同。

知乎相关讨论里有人写了这么一段:AI在理论科学中不会缩小差距,反而会放大差距。少数有判断力的研究者驾驭AI攻克一个又一个难题,更多的人只能看到AI输出的"看起来好像对"的结果,自己还看不出来哪里有问题。

这话扎心,但跟Parisi的实验对得上。如果大量研究者强行用AI挑战远超自己判断力的课题,产出一堆逻辑上似是而非的论证,自己又缺乏鉴别能力,这对学术体系的伤害可能比不用AI还大。一个能产生"看似合理但实际错误"的论证工具,在缺乏足够审阅能力的场景下,比没有这个工具更危险。

几个没有答案的问题

Parisi的实验留下一些值得追问的东西。

第一,这不是"AI要取代科学家"的故事,反过来更像是一个顶级科学家把AI当成思维延伸的案例。Parisi全程主导:设起点、纠偏、突破瓶颈、核验成果。AI承担了推导和计算的重活,但每一步的方向和终点都在人的掌控中。如果只看到"AI证明了12年猜想"而忽略了"谁在驾驭AI",那对这个事件的理解就缺了最关键的一层。

第二,公开对话记录的做法能不能推广?Parisi是诺奖得主,他公开自己的草稿不会有人质疑他的学术地位。一个博士生或年轻研究员愿不愿意、敢不敢把自己的AI交互过程全部透明化,是另一回事。在"不公开就不透明、公开了又可能暴露自己的弱点"之间,学术界还没有找到平衡点。

第三,当AI的推导能力越来越强,同行评审的负担会加重还是减轻?如果审稿人需要同时验证论文结论和AI推导过程,工作量实际上增加了。但如果对话记录像Parisi这样完整公开,验证过程又可能变得更系统、更有迹可循。哪种情形会成为常态,取决于学界能不能在AI参与科研的规范上尽快达成共识。

最后回到Claude说的那句话:"不浪漫的版本,往往更接近真相。"它是在说自己没有灵感,全靠逆向推理和硬算。但整件事里最诚实的可能就是这句话。AI不浪漫,所以不该被浪漫化。真正值得关注的,不是AI有多聪明,而是坐在它前面的人知不知道自己在问什么、知不知道答案长什么样。


参考信源:

  • Parisi, G. & Zamponi, F. "A proof of an identity for the critical exponents of jamming." arXiv:2606.03300, 2026年6月.

  • Parisi, G. & Zamponi, F. 对话记录. Zenodo 20478428, 2026年6月.

  • Charbonneau, P., Kurchan, J., Parisi, G., Urbani, P., Zamponi, F. 相关2014年论文. Journal of Statistical Mechanics.

  • 《人工智能与数学莱顿宣言》. 2026年6月2日发布. leidendeclaration.ai.

  • 新智元."诺奖得主联手Claude,40轮对话证出12年物理猜想." 2026年6月8日.

  • 澎湃新闻."《AI人工智能与数学莱顿宣言》重磅发布,获得国际数学联盟IMU采纳和全力支持." 2026年6月3日.

  • CSDN博客."OpenAI模型攻克离散几何80年难题:Erdős单位距离猜想被AI证明." 2026年6月7日.

  • 企鹅号."150余位数学家联名警告:切勿轻信AI解决数学难题的炒作." 2026年6月6日.

© 版权声明

相关文章

暂无评论

暂无评论...

网址设置

网址样式切换

详细

网址卡片按钮

显示

布局设置

左侧边栏菜单

展开

页面最大宽度

1700px

搜索框设置

搜索框背景上下位置

仅对图片背景生效

50%

自定义搜索框背景

  • 静图

    随机壁纸

  • 静图

    随机4K

自定义搜索框高度

  • 聚焦
  • 信息
  • 默认
设置