Transformer合著者转身：Sakana AI要用“自我进化”打破算力困局

2026年的AI赛场，跑在最前面的永远是那几张老面孔——OpenAI、Google、Anthropic。它们的故事里永远离不开一个词：算力。数十亿美元的资金、数以万计的GPU、连绵不绝的电力消耗，构成了一幅烧钱竞赛的浮世绘。

但有一个日本人不想跟着玩了。

2023年夏天，前Google研究员、Transformer架构原始论文合著者Llion Jones在日本东京创立了Sakana AI。他的核心赌注听起来像科幻：让AI自己改进自己。2026年6月，Sakana AI正式宣布成立专门的递归自我改进（RSI）研究实验室，决心把“自我进化”从理论变成现实。

说实话，我对这个方向既期待又警惕。它可能是AI发展的下一个分水岭，也可能是一条通往未知的危险岔路。

Transformer发明者出走Google：不是不看好，是想探索另一条路

Llion Jones不是AI圈的无名之辈。2017年，他作为第八作者参与了Google那篇改变世界的论文《Attention Is All You Need》，这篇论文奠定了当代大语言模型的技术基石。此后他在Google Brain和DeepMind工作多年，亲眼见证了Transformer架构如何催生出GPT、BERT、Claude等一系列明星产品。

按理说，他应该是这条技术路线最大的受益者之一。但他偏偏选择了离开。

2023年8月接受媒体采访时，Jones解释了自己的逻辑：“我不想只是在大公司里优化现有架构。我想探索一些完全不同的东西。” 他口中的“完全不同的东西”，就是Sakana AI所押注的方向——受自然进化启发的AI系统。

Sakana这个词源自日语的“sanak”，意为“鱼”，公司logo也是一条游动的鱼。Jones和他的团队想用进化算法的思路，让AI系统像生物进化一样，在没有中心化设计的情况下逐步优化自身。这与传统大模型那种“更大、更多数据、更多算力”的Scaling Law路线形成了鲜明对比。

公司成立至今获得了数千万美元级别的融资，投资方包括多家顶级风投。虽然具体金额未被披露，但在当前AI赛道普遍需要数亿乃至数十亿美元才能跑通商业化的情况下，这个数字说明资本市场对这个方向是有期待的。

算力军备竞赛的困局： Scaling Law还能跑多远？

要理解Sakana AI为什么选择RSI这个方向，我们得先看看当前AI发展的瓶颈在哪。

过去几年，AI能力的提升基本遵循一个简单粗暴的规律：规模越大，效果越好。GPT-2只有15亿参数，GPT-3飙到1750亿，GPT-4据传超过万亿级别。每次参数量的跃升，都伴随着训练成本的指数级增长。

但问题是，这条路正在变得越来越难走。

首先，是电力瓶颈。训练一次GPT-4级别的大模型，耗电量据估算超过50GWh，相当于数万个家庭一年的用电量。OpenAI正在规划的下一代模型，传闻需要数千兆瓦的电力供应——这已经不是一个公司能解决的问题，而是整个电网都需要为此升级。

其次，是边际效益递减。《Nature》在2024年底发表的一项研究显示，在语言理解、数学推理等核心任务上，模型性能提升的速度正在放缓。简单堆算力的收益正在变薄。大厂们心里其实都清楚，纯靠Scaling Law已经很难维持之前那种“一年一个数量级”的增速了。

这就是Sakana AI看到的机会。如果AI能够自己改进自己，那么改进的过程本身就会变得更高效，不需要人类工程师手动设计新架构、调新参数、喂新数据。这条路如果走得通，就意味着可以用更少的外部资源，让AI系统实现持续的性能提升。

RSI：从科幻概念到严肃研究

递归自我改进（RSI）并不是一个新概念。早在上世纪50年代，计算机先驱图灵就设想过能够自我改进的机器。近年来，随着AI能力的突飞猛进，这个概念重新进入主流研究视野。

简单理解，RSI就是让AI系统能够：

- 评估自身当前的能力水平和不足之处
- 生成改进方案或新的训练数据
- 执行改进并验证效果
- 重复这个过程，形成迭代闭环

Sakana AI的思路受进化论启发很深。他们的研究团队认为，生物进化用了几十亿年，通过自然选择和变异，发展出了极其复杂和精密的智能系统。AI的自我改进也可以借鉴这种分布式、去中心化的优化机制，而不是依赖一个“全能设计师”。

当然，这个方向的风险也是显而易见的。

Anthropic在2024年发布的一份技术安全报告中明确表达了对RSI的担忧。他们认为，如果一个AI系统能够持续改进自身，它的智能水平可能在短时间内超过人类预期，而且这种能力的提升可能变得难以预测和控制。Anthropic的安全研究员Chris van der Merwe在接受采访时曾表示：“递归自我改进系统的一个关键风险在于，我们可能无法准确判断它什么时候会达到一个'关键阈值'，越过之后人类就很难再有效地监管它了。”

这个担忧并非杞人忧天。一个能够不断优化自身的系统，理论上可以加速自身的进化速度。如果这种进化失控，后果确实难以估量。

写在最后：一条少有人走的路

我必须承认，Sakana AI选择的这条路，在当前AI赛道里相当非主流。

当几乎所有大厂都在All in Scaling Law、争相建设超算中心的时候，这家日本小公司却想另辟蹊径，用“自我进化”替代“算力堆叠”。这需要的不只是技术能力，更需要一种对未来的坚定信念。

Llion Jones显然是有这个信念的。作为Transformer架构的缔造者之一，他比大多数人更清楚现有技术的天花板在哪里。他选择在这个时候站出来挑战Scaling Law，至少说明在他看来，这条路已经接近瓶颈，或者至少不是唯一正确的答案。

不过，理想和现实之间往往隔着巨大的鸿沟。RSI从概念到落地，中间还有无数的技术难题要攻克。Sakana AI最终能否证明这条路可行，现在下结论还为时过早。

但有一点是确定的：AI的未来不应该只有一种叙事。如果有一天，某家公司真的能用更聪明的方式，而不是更贵的方式，让AI持续进化，那将是对整个行业格局的一次彻底重构。

我愿意给这条路多一点耐心。毕竟，当年Transformer刚出现的时候，也没有多少人真正看好它能改变世界。

# 软件科技 # AI创业 # AI发展 # AI安全 # AI自我进化 # Llion Jones # Sakana AI # Scaling Law # Transformer合著者 # 东京AI公司 # 低算力AI # 大语言模型 # 算力困局 # 自然进化启发 # 进化算法 # 递归自我改进

本站专栏文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

Transformer合著者转身：Sakana AI要用“自我进化”打破算力困局

Transformer合著者转身：Sakana AI要用“自我进化”打破算力困局

Transformer发明者出走Google：不是不看好，是想探索另一条路

算力军备竞赛的困局： Scaling Law还能跑多远？

RSI：从科幻概念到严肃研究

写在最后：一条少有人走的路

日本农户Hiroki Tomiyasu用ChatGPT和Codex自行搭建工具运营100公顷农场

纽约举起禁令大棒：AI算力狂欢背后的能源困局

相关文章

暂无评论

最新文章

站点公告

网址设置

网址样式切换

网址卡片按钮

布局设置

左侧边栏菜单

页面最大宽度

搜索框设置

搜索框背景上下位置

自定义搜索框背景

自定义搜索框高度

Transformer合著者转身：Sakana AI要用“自我进化”打破算力困局

Transformer合著者转身：Sakana AI要用“自我进化”打破算力困局

Transformer发明者出走Google：不是不看好，是想探索另一条路

算力军备竞赛的困局： Scaling Law还能跑多远？

RSI：从科幻概念到严肃研究

写在最后：一条少有人走的路

日本农户Hiroki Tomiyasu用ChatGPT和Codex自行搭建工具运营100公顷农场

纽约举起禁令大棒：AI算力狂欢背后的能源困局

相关文章

暂无评论

最新文章

站点公告

🇦🇩

网址设置

网址样式切换

网址卡片按钮

布局设置

左侧边栏菜单

页面最大宽度

搜索框设置

搜索框背景上下位置

自定义搜索框背景

自定义搜索框高度