
Transformer合著者转身:Sakana AI要用“自我进化”打破算力困局
2026年的AI赛场,跑在最前面的永远是那几张老面孔——OpenAI、Google、Anthropic。它们的故事里永远离不开一个词:算力。数十亿美元的资金、数以万计的GPU、连绵不绝的电力消耗,构成了一幅烧钱竞赛的浮世绘。
但有一个日本人不想跟着玩了。
2023年夏天,前Google研究员、Transformer架构原始论文合著者Llion Jones在日本东京创立了Sakana AI。他的核心赌注听起来像科幻:让AI自己改进自己。2026年6月,Sakana AI正式宣布成立专门的递归自我改进(RSI)研究实验室,决心把“自我进化”从理论变成现实。
说实话,我对这个方向既期待又警惕。它可能是AI发展的下一个分水岭,也可能是一条通往未知的危险岔路。
Transformer发明者出走Google:不是不看好,是想探索另一条路
Llion Jones不是AI圈的无名之辈。2017年,他作为第八作者参与了Google那篇改变世界的论文《Attention Is All You Need》,这篇论文奠定了当代大语言模型的技术基石。此后他在Google Brain和DeepMind工作多年,亲眼见证了Transformer架构如何催生出GPT、BERT、Claude等一系列明星产品。
按理说,他应该是这条技术路线最大的受益者之一。但他偏偏选择了离开。
2023年8月接受媒体采访时,Jones解释了自己的逻辑:“我不想只是在大公司里优化现有架构。我想探索一些完全不同的东西。” 他口中的“完全不同的东西”,就是Sakana AI所押注的方向——受自然进化启发的AI系统。
Sakana这个词源自日语的“sanak”,意为“鱼”,公司logo也是一条游动的鱼。Jones和他的团队想用进化算法的思路,让AI系统像生物进化一样,在没有中心化设计的情况下逐步优化自身。这与传统大模型那种“更大、更多数据、更多算力”的Scaling Law路线形成了鲜明对比。
公司成立至今获得了数千万美元级别的融资,投资方包括多家顶级风投。虽然具体金额未被披露,但在当前AI赛道普遍需要数亿乃至数十亿美元才能跑通商业化的情况下,这个数字说明资本市场对这个方向是有期待的。
算力军备竞赛的困局: Scaling Law还能跑多远?
要理解Sakana AI为什么选择RSI这个方向,我们得先看看当前AI发展的瓶颈在哪。
过去几年,AI能力的提升基本遵循一个简单粗暴的规律:规模越大,效果越好。GPT-2只有15亿参数,GPT-3飙到1750亿,GPT-4据传超过万亿级别。每次参数量的跃升,都伴随着训练成本的指数级增长。
但问题是,这条路正在变得越来越难走。
首先,是电力瓶颈。训练一次GPT-4级别的大模型,耗电量据估算超过50GWh,相当于数万个家庭一年的用电量。OpenAI正在规划的下一代模型,传闻需要数千兆瓦的电力供应——这已经不是一个公司能解决的问题,而是整个电网都需要为此升级。
其次,是边际效益递减。《Nature》在2024年底发表的一项研究显示,在语言理解、数学推理等核心任务上,模型性能提升的速度正在放缓。简单堆算力的收益正在变薄。大厂们心里其实都清楚,纯靠Scaling Law已经很难维持之前那种“一年一个数量级”的增速了。
这就是Sakana AI看到的机会。如果AI能够自己改进自己,那么改进的过程本身就会变得更高效,不需要人类工程师手动设计新架构、调新参数、喂新数据。这条路如果走得通,就意味着可以用更少的外部资源,让AI系统实现持续的性能提升。
RSI:从科幻概念到严肃研究
递归自我改进(RSI)并不是一个新概念。早在上世纪50年代,计算机先驱图灵就设想过能够自我改进的机器。近年来,随着AI能力的突飞猛进,这个概念重新进入主流研究视野。
简单理解,RSI就是让AI系统能够:
- 评估自身当前的能力水平和不足之处
- 生成改进方案或新的训练数据
- 执行改进并验证效果
- 重复这个过程,形成迭代闭环
Sakana AI的思路受进化论启发很深。他们的研究团队认为,生物进化用了几十亿年,通过自然选择和变异,发展出了极其复杂和精密的智能系统。AI的自我改进也可以借鉴这种分布式、去中心化的优化机制,而不是依赖一个“全能设计师”。
当然,这个方向的风险也是显而易见的。
Anthropic在2024年发布的一份技术安全报告中明确表达了对RSI的担忧。他们认为,如果一个AI系统能够持续改进自身,它的智能水平可能在短时间内超过人类预期,而且这种能力的提升可能变得难以预测和控制。Anthropic的安全研究员Chris van der Merwe在接受采访时曾表示:“递归自我改进系统的一个关键风险在于,我们可能无法准确判断它什么时候会达到一个'关键阈值',越过之后人类就很难再有效地监管它了。”
这个担忧并非杞人忧天。一个能够不断优化自身的系统,理论上可以加速自身的进化速度。如果这种进化失控,后果确实难以估量。
写在最后:一条少有人走的路
我必须承认,Sakana AI选择的这条路,在当前AI赛道里相当非主流。
当几乎所有大厂都在All in Scaling Law、争相建设超算中心的时候,这家日本小公司却想另辟蹊径,用“自我进化”替代“算力堆叠”。这需要的不只是技术能力,更需要一种对未来的坚定信念。
Llion Jones显然是有这个信念的。作为Transformer架构的缔造者之一,他比大多数人更清楚现有技术的天花板在哪里。他选择在这个时候站出来挑战Scaling Law,至少说明在他看来,这条路已经接近瓶颈,或者至少不是唯一正确的答案。
不过,理想和现实之间往往隔着巨大的鸿沟。RSI从概念到落地,中间还有无数的技术难题要攻克。Sakana AI最终能否证明这条路可行,现在下结论还为时过早。
但有一点是确定的:AI的未来不应该只有一种叙事。如果有一天,某家公司真的能用更聪明的方式,而不是更贵的方式,让AI持续进化,那将是对整个行业格局的一次彻底重构。
我愿意给这条路多一点耐心。毕竟,当年Transformer刚出现的时候,也没有多少人真正看好它能改变世界。
