诺奖得主让AI证了一道12年的题，然后他把草稿全公开了

2026年6月初，arXiv上出现了一篇12页的物理论文，编号2606.03300。没有实验数据，没有图表，只有一个纯解析证明，关于阻塞转变临界指数之间的一个恒等式。论文作者是2021年诺贝尔物理学奖得主Giorgio Parisi和他的长期合作者Francesco Zamponi。

真正引发讨论的不是论文本身，而是致谢里的一句话。Parisi写道，这个证明"基本上是Claude自己推出来的"。他还在Zenodo上公开了与Claude的全部40轮对话记录（编号20478428），每一步推导、每一次出错、每一回推倒重来，任何人都能下载翻看。

一道卡了物理学界12年的等式，40轮人机对话，最终被啃了下来。但这件事值得说的，远不止那个证明。

一个等了12年的等式

2014年，Parisi、Zamponi和另外几位物理学家（Charbonneau、Kurchan、Urbani，学界称CKPUZ组）在研究无穷维硬球阻塞理论时，发现两个临界指数a和b之间存在一个出奇简洁的数值关系：a+b=1。数值验证反复做了很多次，小数点后好几位都吻合。但解析证明，12年里没人做出来。

a+b=1不是一道孤立的代数题。它连接了两条各自独立的理论线索：full-RSB解里的"相空间边缘稳定性"和堆积体系里的"力学边缘稳定性"。证明这个等式，等于在说这两种边缘稳定在无穷维理论框架下其实是同一回事。

这里需要交代一下背景。full-RSB，全称full replica symmetry breaking，即全复本对称破缺，是Parisi在自旋玻璃研究中构建的核心工具。1980年前后，他发现只有full-RSB才能给自旋玻璃低温相一个自洽的解，此前的"负熵灾难"由此解决。这套东西后来被广泛应用到玻璃化转变、颗粒物质、优化问题、物种演化、神经网络乃至引力理论。

Parisi拿诺贝尔奖，主要就是因为这套东西。

所以这道题踩在他自己理论的根基上。他把最后一块缺口交给AI去补，补上之后还把全过程公开，这个选择本身比证明更有意思。

40轮对话里到底发生了什么

对话记录公开之后，过程可以被逐段还原。

早期，Parisi给Claude的指令很具体：写C++代码，用打靶法解一个非线性微分方程，精度要求10的负10次方。Claude在这个阶段扮演的是程序员角色。它调试代码、提升精度，从双精度做到四精度，数值结果一路逼近小数点后十几位。这些枯燥的数字后来成了它做解析推导的锚点。

中间有个插曲。Parisi把方程写错了，函数写串了。Claude在这个错方程上跑了很久，正确地指出了方程本身无解。Parisi回头检查才发现是自己的笔误。

转折点出现在Parisi的一句话之后。他说："我自己接下来能搞定了。你应该注意到a+b约等于1精度极高。有人猜想这个关系是精确成立的。我要你做一个解析计算，证明它。"

从这句指令开始，Claude的角色从程序员变成了推演者。

它的证明逻辑大致是：从数值结果锁定目标恒等式a+c/2=1/2，逆向构造一个辅助函数，经过两次代数消去得出关键恒等式，再结合已知物理条件推出a=(1-c)/2，即a+b=1。

后来Parisi问它"你怎么想到的"，Claude的回答没什么戏剧性。它说不是什么灵光一现，辅助函数是从想要的结论反推出来的，"一套相当系统的逆向推理，加上小心的计算。"然后它加了一句："不浪漫的版本，往往更接近真相。"

人类科学家在干什么

Claude交出来的初稿并不完美。其中一步需要论证某个函数f恒不为负，Claude用了极值原理的论证。Zamponi直接指出这个论证有问题：在极小值处，方程给出的结果跟极小条件是相容的，构不成Claude以为的那个矛盾。

Claude没有争辩。"你的朋友是对的，我犯了一个符号错误。"然后它一步步复盘，上界论证成立打了个勾，下界论证失败打了个叉。

纠错是双向的。合作者自己算的一个渐近行为里有小错，被Claude挑出来，还顺带定位了错误来源。

但整个过程中Claude最过不去的坎，不是计算也不是推导，是问题本身问错了。

Parisi后来提醒Claude：你证不出那个函数"永远非负"，因为这个方程的解不止一个，大多数解都在零线上下来回摆。打靶法选中的是唯一一个不摆动的特解。所以从一开始就不该问"它是不是一定非负"，而该问"到底有没有一个始终非负的解"。

然后Parisi给出了破局思路：别死磕极限方程了，回到更上游的原始方程，重新定义一个随尺度演化的函数。只要证明这个演化过程不破坏非负性，而初始条件又是非负的，证明就通了。Claude沿这条路走下去，把它转化成标准的反应扩散方程，用成熟的极值原理补完了证明。

设问题、指方向的是人。推演、计算的是AI。Parisi自己的总结最直接：AI负责推和算，人类负责设问题、挑错、核验和拍板。

透明是新的信誉

Parisi把全部对话公开，这件事的分量不亚于证明本身。

传统论文里，工具的贡献通常是一句"我们借助了某某软件"或"计算由某某程序完成"，至于工具具体做了什么、在哪里出错、人又是如何纠正的，全被压扁成一个致谢。这次不一样。每一段推导、每一次碰壁、每一个纠错，都可以追溯。

如果这种做法变成常态，科学验证的方式会跟着变。以前审稿人只能看到最终成品，现在他们能看到整个生产过程。哪些步骤是AI独立完成的，哪些是人修正的，哪里推倒重来过，全都有据可查。

这对AI参与科研这件事本身也是一种约束。公开对话记录意味着吹不了牛。AI到底贡献了多少，翻开记录就知道。Parisi自己说证明"基本上是Claude自己推出来的"，这话听着像在夸AI，但把对话公开之后，所有人都能看到Claude在哪个地方卡住了、在哪里犯了错、是谁把它拉回正轨的。夸奖和诚实并不矛盾。

同一时期的另一面

Parisi的论文不是孤例。2026年上半年，AI在数学和理论物理领域的介入明显加速。

2026年5月20日，OpenAI宣布其内部一个通用推理模型推翻了"平面单位距离猜想"，保罗·埃尔德什1946年提出的几何问题，悬了将近80年。菲尔兹奖得主蒂莫西·高尔斯称之为"AI数学的里程碑"，同时说了一句让同行坐不住的话："我们或许已经进入一个人类在解数学题方面很难和AI竞争的时代了。"

更早一些，一名23岁、没有正式数学训练背景的年轻人声称利用AI解决了埃尔德什问题#1196。有报道引用陶哲轩的评价，称解法有独创性，关注过这道题的人类数学家"集体在第一步就走错了方向"。

但就在这些消息引发热议的那几天，数学界发出了另一种声音。

2026年6月2日，《人工智能与数学莱顿宣言》正式发布。这份宣言起源于2025年9月莱顿大学洛伦兹中心的一场工作坊，10国约60名学者参与讨论，之后半年间打磨成文，获得国际数学联盟的采纳和支持。起草者为16位来自全球顶尖高校的数学家。到6月初，签署人数已从最初的几十人增长到超过2000位学者。

宣言列举了五大风险：隐蔽的错误证明、引用缺失、工具鸿沟、能力误判，以及商业议程对研究自主性的侵蚀。国际数学联盟副主席Tillmann指出，科技公司有夸大产品能力的商业动机。牛津大学的Goldberg说，当前的自动化技术能产生"看似合理但不可靠甚至错误的论证，跟正确的证明很难区分开"。

这两个态度之间存在一种张力。一边是AI确实在解题，Parisi的实验、OpenAI的成果都是实打实的。另一边是数学界对AI解题能力的警惕，不是否认事实，而是担忧事实被夸大、被误读、被用来推销产品。

AI是放大器，不是均衡器

Parisi的实验展示了AI在科研中一种"不完美但可用"的状态：它会犯错，但能认错；推演时走偏了，在人的引导下能回到正确路径。真正的问题不是AI能不能完美解题，而是坐在AI对面那个人有没有能力判断它对不对。

Parisi能引导Claude回到理论的源头、在关键转折点重新设定问题、在证明出错时一眼看出漏洞，这些能力AI替代不了。换句话说，这次实验的成功前提是使用者的水准足够高。换一个人坐在对面，结果可能完全不同。

知乎相关讨论里有人写了这么一段：AI在理论科学中不会缩小差距，反而会放大差距。少数有判断力的研究者驾驭AI攻克一个又一个难题，更多的人只能看到AI输出的"看起来好像对"的结果，自己还看不出来哪里有问题。

这话扎心，但跟Parisi的实验对得上。如果大量研究者强行用AI挑战远超自己判断力的课题，产出一堆逻辑上似是而非的论证，自己又缺乏鉴别能力，这对学术体系的伤害可能比不用AI还大。一个能产生"看似合理但实际错误"的论证工具，在缺乏足够审阅能力的场景下，比没有这个工具更危险。

几个没有答案的问题

Parisi的实验留下一些值得追问的东西。

第一，这不是"AI要取代科学家"的故事，反过来更像是一个顶级科学家把AI当成思维延伸的案例。Parisi全程主导：设起点、纠偏、突破瓶颈、核验成果。AI承担了推导和计算的重活，但每一步的方向和终点都在人的掌控中。如果只看到"AI证明了12年猜想"而忽略了"谁在驾驭AI"，那对这个事件的理解就缺了最关键的一层。

第二，公开对话记录的做法能不能推广？Parisi是诺奖得主，他公开自己的草稿不会有人质疑他的学术地位。一个博士生或年轻研究员愿不愿意、敢不敢把自己的AI交互过程全部透明化，是另一回事。在"不公开就不透明、公开了又可能暴露自己的弱点"之间，学术界还没有找到平衡点。

第三，当AI的推导能力越来越强，同行评审的负担会加重还是减轻？如果审稿人需要同时验证论文结论和AI推导过程，工作量实际上增加了。但如果对话记录像Parisi这样完整公开，验证过程又可能变得更系统、更有迹可循。哪种情形会成为常态，取决于学界能不能在AI参与科研的规范上尽快达成共识。

最后回到Claude说的那句话："不浪漫的版本，往往更接近真相。"它是在说自己没有灵感，全靠逆向推理和硬算。但整件事里最诚实的可能就是这句话。AI不浪漫，所以不该被浪漫化。真正值得关注的，不是AI有多聪明，而是坐在它前面的人知不知道自己在问什么、知不知道答案长什么样。

参考信源：

Parisi, G. & Zamponi, F. "A proof of an identity for the critical exponents of jamming." arXiv:2606.03300, 2026年6月.
Parisi, G. & Zamponi, F. 对话记录. Zenodo 20478428, 2026年6月.
Charbonneau, P., Kurchan, J., Parisi, G., Urbani, P., Zamponi, F. 相关2014年论文. Journal of Statistical Mechanics.
《人工智能与数学莱顿宣言》. 2026年6月2日发布. leidendeclaration.ai.
新智元."诺奖得主联手Claude，40轮对话证出12年物理猜想." 2026年6月8日.
澎湃新闻."《AI人工智能与数学莱顿宣言》重磅发布，获得国际数学联盟IMU采纳和全力支持." 2026年6月3日.
CSDN博客."OpenAI模型攻克离散几何80年难题：Erdős单位距离猜想被AI证明." 2026年6月7日.
企鹅号."150余位数学家联名警告：切勿轻信AI解决数学难题的炒作." 2026年6月6日.

# 自媒体专栏 # 40轮对话 # a+b=1恒等式 # AI数学风险 # AI科研 # arXiv论文 # Claude # Claude AI # Parisi # 人机协作 # 全复本对称破缺 # 学术透明度 # 理论物理证明 # 科学放大器 # 莱顿宣言 # 诺奖得主 # 阻塞转变

本站专栏文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

诺奖得主让AI证了一道12年的题，然后他把草稿全公开了

一个等了12年的等式

40轮对话里到底发生了什么

人类科学家在干什么

透明是新的信誉

同一时期的另一面

AI是放大器，不是均衡器

几个没有答案的问题

七万字从底层写到VP，钉钉的病为什么治不好

你用了二十年的手机号，值多少钱？三大运营商"新老不同权"背后的算术题

相关文章

暂无评论

最新文章

站点公告

网址设置

网址样式切换

网址卡片按钮

布局设置

左侧边栏菜单

页面最大宽度

搜索框设置

搜索框背景上下位置

自定义搜索框背景

自定义搜索框高度

诺奖得主让AI证了一道12年的题，然后他把草稿全公开了

一个等了12年的等式

40轮对话里到底发生了什么

人类科学家在干什么

透明是新的信誉

同一时期的另一面

AI是放大器，不是均衡器

几个没有答案的问题

七万字从底层写到VP，钉钉的病为什么治不好

你用了二十年的手机号，值多少钱？三大运营商"新老不同权"背后的算术题

相关文章

暂无评论

最新文章

站点公告

🇦🇩

网址设置

网址样式切换

网址卡片按钮

布局设置

左侧边栏菜单

页面最大宽度

搜索框设置

搜索框背景上下位置

自定义搜索框背景

自定义搜索框高度