
当AI开始主动“提问题”:MIT团队如何重新定义科学发现的边界
你有没有想过一个问题:当我们用AI去“解决”科学难题时,AI其实并不知道自己在做什么——它只是在执行一套预定义的搜索策略,在人类给定的概念空间里寻找答案。这就像让一个天才学生只做选择题,却从不让他出题。
MIT的一个研究团队正在尝试改变这种局面。他们提出了一套名为“自我演进AI科学家”的框架,核心目标是让AI不仅能解决问题,还能主动识别当前的概念空间是否足够大,如果不够,就自己创造新的科学概念来扩展这个空间。这个研究发表在arXiv论文2606.01444(2026)中。
说实话,这听起来有点像是科幻小说里的场景,但看完论文后,我觉得这可能是近年来AI for Science领域最有野心的一次尝试。
从“找答案”到“扩空间”:AI科学家面临的核心困境
要理解MIT这个框架的价值,我们得先知道现有AI在科学发现中的局限性。
AI for Science的故事要从1990年代讲起。那时候,Hod Lipson领导的团队开发了Eureqa系统,这个程序能够从实验数据中自动发现物理定律的数学表达式。举个栗子,你给它摆锤运动的数据,它能自己“悟”出单摆周期的公式。这种能力当时震惊了整个科学界。
但问题也很明显:Eureqa也好,后来更先进的AI系统也好,它们的搜索都是在固定的符号空间里进行的。AI被给定了一组变量、一套语法规则,然后它的工作就是穷举各种可能的组合。这就像是给你一堆乐高积木,让你搭出任何东西——但你只能用现有的积木,不能发明新的形状。
2024年,AlphaFold团队因为解决蛋白质结构预测问题获得了诺贝尔化学奖。这个成就当然了不起,但你仔细想想就会发现:AlphaFold并不知道什么是“蛋白质”,什么是“进化”,什么是“生命”。它只是学会了从氨基酸序列预测三维结构。它在给定的问题空间里表现优异,但它无法质疑这个空间本身是否足够完整。
MIT团队在论文中指出了这个根本性的限制:当前的AI科学家其实只是“高级检索”和“穷举搜索”的结合体。检索是添加已知对象,搜索是在固定模式里穷举选项,但这两者都无法产生真正意义上的科学发现——因为真正的发现需要扩展概念空间本身。
形式化“发现”:用范畴论给科学创新一个数学定义
MIT团队解决这个问题的方式很有意思:他们没有直接去造一个“会创造概念的AI”,而是先花大力气去形式化定义什么才是真正的科学发现。
这是非常MIT的做法——在动手之前,先把问题用数学语言精确地描述清楚。
他们的核心框架是这样的:把科学活动中遇到的一切都视为“带类型的artifact”。这包括实验数据点、模型、工具的输出、失败的尝试、甚至最终的结论声明。在传统AI系统里,这些东西要么被当作无差别的字符串,要么干脆被忽略。但在MIT的框架里,每个artifact都有明确的类型标注。
为什么要这么做?因为只有这样,AI才能区分什么是“检索已知知识”、什么是“在固定模式里搜索”、什么是“真正的发现”。
具体来说,他们引入了三个层次的区别:
第一层:检索(Retrieval)。这是添加已知对象到上下文中。比如你问AI“量子力学的基本方程是什么”,它从知识库里调出薛定谔方程。这是在已有空间里找东西。
第二层:搜索(Search)。这是在固定schema里探索可能的状态组合。比如AlphaFold做的事情——给定氨基酸序列,穷举所有可能的折叠构型。空间是固定的,只是搜索深度增加了。
第三层:发现(Discovery)。这是可验证的模式扩展,也是MIT框架最看重的部分。真正的发现意味着你创造了一个新的概念或关系,它不在原来的空间里,但它能解释旧数据,而且能预测新现象。
为了给“发现”一个严格的数学定义,MIT团队引入了类型化copresheaf和Kan障碍理论。这些术语听起来吓人,但背后的直觉其实很直观:
想象你在拼一幅巨大的拼图。拼图的不同区域代表不同的知识模块。copresheaf是一种数学结构,它描述了这些模块之间如何“粘合”在一起——也就是证据如何在不同的科学概念之间传递。Kan障碍理论则告诉我们,在什么情况下这种传递会失败——当它失败时,就说明你当前的概念空间不够用了,需要扩展。
MIT团队证明了:真正的科学发现本质上是一个左Kan扩展。旧证据需要能够通过这个新引入的概念顺畅地传递到新的理论框架中。如果这种传递被打断(出现Kan障碍),那就说明你所谓的“新概念”与现有知识体系不兼容,需要重新审视。
更妙的是,创新性可以被逐点残差量化。这就像是你在解一道数学题,标准解法给出了答案A,但你的解法给出了答案A',两者之间的差异就是你原创性贡献的度量。
两个案例:蛋白质设计规则与纤维网络刚度
说了这么多理论,可能有人要问了:这玩意儿实际用起来怎么样?
MIT团队给了两个具体案例来演示框架的能力。
案例一:Builder/Breaker模型与蛋白质模式顺应性
在蛋白质工程领域,一个核心问题是:什么样的氨基酸序列能够折叠成稳定的、功能性的三维结构?传统方法是实验筛选——合成一大堆序列,看哪些能形成想要的折叠。这效率极低。
MIT团队用他们的框架构建了一个Builder/Breaker模型。简单来说:
- Builder负责提出可能产生目标结构的序列设计方案
- Breaker负责识别这些设计方案中的潜在缺陷和冲突
两者的对抗性交互让系统能够快速收敛到可行的设计方案。但框架的真正威力在于:它不只是在给定空间里搜索,它能够主动引入新的概念来解释Builder和Breaker之间的分歧。
具体来说,团队发现了一个他们称之为“条件顺应性”的模式。传统的蛋白质设计原则强调氨基酸的物理化学性质——疏水性、极性、带电情况等。但MIT的框架发现,在某些特定的拓扑约束下,序列对某种性质的依赖程度本身是可以被动态调整的。换句话说,一个在正常情况下很重要的物理约束,在特定的折叠路径下可以被“绕过”。
这个发现不是从数据里直接读出来的,而是框架通过扩展概念空间——引入“条件顺应性”这个新概念——才揭示出来的。
案例二:CategoryScienceClaw与各向异性纤维网络刚度规则
第二个案例涉及材料科学。纤维网络(比如 collagen凝胶、生物组织、某些复合材料)具有复杂的力学性质,它们的刚度取决于纤维的排列方式、交叉点的连接强度、以及整体网络的拓扑结构。
MIT团队开发的CategoryScienceClaw系统在这个领域发现了一条有趣的新规则:对于各向异性的纤维网络——也就是纤维有偏好方向的排列方式——刚度不仅仅取决于纤维本身的刚度,还取决于方向分布的熵值与交叉点各向异性度之间的耦合方式。
传统理论要么关注均质网络,要么关注完全有序的晶体结构。对于“部分有序、但存在随机扰动”的中间态,一直缺乏好的描述。CategoryScienceClaw通过扩展概念空间,引入了一个描述这种耦合关系的算子,并给出了可验证的预测:可以通过测量方向熵和交叉各向异性来预测整体刚度的跃迁点。
实验验证表明,这个预测在多种材料体系中都是准确的。
从工具到伙伴:AI科学家的下一个十年
看完MIT这个框架,我有一个比较强的感受:我们正在进入AI for Science的第二个阶段。
第一个阶段是AI as a tool——把AI当作更强大的数据处理和模式识别工具。AlphaFold就是典型代表,它解决的是一个定义明确的问题,只是解决得比人类快得多好得多。
第二个阶段是AI as a partner——让AI成为能够与人类科学家真正协作的伙伴。这意味着AI不仅要能执行任务,还要能理解任务的边界在哪里,哪些边界可能是人为设定的限制,以及如何突破这些限制去发现新的东西。
MIT的框架当然还有很长的路要走。把范畴论和Kan障碍理论工程化地实现,本身就是巨大的挑战。更不用说让AI真正产生有科学价值的“新概念”了——这需要的可能不仅仅是算法创新,还有对“意义”和“理解”的更深层把握。
但我觉得,这个方向是对的。科学发现的本质从来不只是穷举搜索,而是在不断质疑和扩展人类认知的边界。如果AI永远只在人类划定的圈子里打转,它永远只能是一个超级计算器,而不是一个真正的科学伙伴。
我比较期待看到的是,这个框架未来能否与其他前沿方向结合——比如与LLM的语义理解能力结合,让AI不只能处理形式化的artifact,还能理解这些artifact背后的物理直觉和科学语境。如果那一天真的到来,我们可能真的要重新思考一个问题:当AI开始主动提问时,科学家这个职业会变成什么样子?
