Transformer 之父转身:Noam Shazeer 终入 OpenAI,一场迟到了三年的 “顶流” 争夺战落幕

软件科技1小时前发布 botnews
65 0 0
Transformer 之父转身:Noam Shazeer 终入 OpenAI,一场迟到了三年的 “顶流” 争夺战落幕

Transformer 之父转身:Noam Shazeer 终入 OpenAI,一场迟到了三年的 “顶流” 争夺战落幕

2017年,谷歌的一篇论文标题叫嚣着要把整个AI圈搅个底朝天——《Attention Is All You Need》。当时大概没几个人能想到,这七个单词会变成今天价值万亿美元战场的起点。那篇论文的七位作者,加上后来被共同认可的第八位Llion Jones,在接下来的几年里像蒲公英的种子一样被风吹向了四面八方。而现在,这场漫长的散落终于拼上了最后一块关键拼图——Noam Shazeer,Transformer 架构的核心发明者,正式宣布加入 OpenAI。

说实话,当我看到这个消息的时候,内心其实是复杂的。这不只是又一个人才流动的八卦,而是一个时代注脚式的节点。Transformer 论文的八位作者,到此全员离开了谷歌。一个时代的黄埔军校,终于送走了最后一位首席工程师。

两次出走谷歌的男人

要理解 Shazeer 这次转会的影响,得先搞清楚他到底是什么量级的存在。

Shazeer 在谷歌的日子最早可以追溯到2000年,那时候大多数人对深度学习这个词还很陌生。他在谷歌一待就是二十多年,中间主导了 Megatron-LM、Switch Transformer 等多项关键研究。但真正让他封神的事件发生在2020年前后——他私下开发了一款聊天机器人,能力强大到让谷歌内部感到“危险”。他向公司提议正式发布,结果被管理层拒绝了。

这个拒绝的代价是巨大的。2021年,Shazeer 辞职创办 Character.AI,那款被谷歌雪藏的聊天机器人技术,直接变成了 Character.AI 的底座。这家公司后来一度估值冲到50亿美元,成为 AI 独角兽阵营中最扎眼的玩家之一。

但谷歌显然不甘心就这么放走自己最重要的技术资产。2024年,谷歌与 Character.AI 达成了一份约25亿至30亿美元的技术许可协议——这个数字在不同的信源中略有差异,但共识是它在25亿美元以上——将 Shazeer 和他的核心技术团队整体请回了谷歌。他回来之后担任的是 Gemini 技术负责人,主导这个被谷歌寄予厚望的大模型系列的研发工作。

请注意这个细节:Shazeer 回来不是以普通员工的身份,而是带着“技术路线决策者”的角色回来的。谷歌为了把他从自己创办的公司里捞回来,付出的代价几乎相当于买下半个独角兽。

一场三个玩家的竞逐

然而,Shazeer 在谷歌的第二次停留也没能持续太久。

从2024年下半年开始,关于他要再次离职的传言就在硅谷不胫而走。据多方信源交叉印证,这次参与争抢 Shazeer 的不只是 OpenAI 一家,xAI 也在列马斯克的 xAI 近年来在 Grok 系列模型上动作频频,同样在寻找顶级技术掌舵人。一个有意思的细节是,Shazeer 最终选择 OpenAI 而非 xAI,这个决定本身就已经说明了 OpenAI 在顶尖人才争夺中的品牌势能。

我个人的判断是,这个选择并不令人意外。OpenAI 虽然在商业化上一直争议不断,但在基础研究吸引力这件事上,它仍然是全球最具号召力的名字。Shazeer 这样的纯技术信仰者,大概率会更看重“能否做出最好的模型”而非其他维度。

值得注意的是,2026年2月,Shazeer 当选为美国国家工程院院士。这个荣誉通常授予那些在工程实践和技术创新中做出杰出贡献的个人。以他的年龄和成就路径,这个院士身份来得并不算早,但放在这个时间节点上,它更像是一个行业公信力认证——确认了 Transformer 发明者在整个技术史坐标系中的位置。

至此,Transformer 论文最初的八位作者,已经全部离开谷歌。Llion Jones 去了韩国一家 AI 初创公司,Ashish Vaswani 和 Niki Parmar 创办了 Essential AI,Aidan Gomez 创办了 Cohere,Noam Shazeer 兜兜转转最终落子 OpenAI。这条故事线到这里,形成了一个近乎完美的叙事闭环。

OpenAI 此刻最需要什么

很多人可能想问:OpenAI 真的还需要一个 Shazeer 吗?

从账面上看,OpenAI 已经坐拥 GPT 系列、Sora、o系列推理模型等技术资产,估值一度逼近2000亿美元。但如果我们把镜头拉近一点,会发现 OpenAI 正在面临一个极其微妙的转型压力——在 Claude、Gemini、开源模型Llama的多重夹击下,它的模型能力优势正在被快速压缩。同时,整个行业都在寻找下一条技术曲线:Agent、具身智能、长上下文推理……每一个方向都需要强大的基础研究能力来驱动。

而 Shazeer 恰恰是那种能定义技术曲线的人。他是混合专家模型(Mixture of Experts)的发明者之一,这项技术现在是几乎所有头部大模型的标配。他的技术直觉和对 Scaling Law 的深刻理解,放在 OpenAI 的研发体系中不会是冗余,而极可能是一针强心剂。

更关键的是,Shazeer 不是一个只会写论文的研究员。他有产品化的冲动——当年因为谷歌拒绝发布他的聊天机器人就愤而出走,这个性格特质意味着他大概率不会满足于做纯粹的理论研究,而是会把技术能力直接导向产品方向。这对于 OpenAI 正在推进的 ChatGPT 企业化和 Agent 产品矩阵来说,是一个相当匹配的信号。

写在最后

Transformer 论文八位作者全员离开谷歌这件事,最让我感慨的其实不是人才流动本身,而是一个更深层的结构性问题:为什么所有最聪明的大脑,最终都选择离开大公司,自己去闯或者去另一家大公司?

谷歌显然不缺乏资源和远见。但当一家公司大到需要层层审批、需要平衡各方利益、需要担心一项技术的发布会不会冲击现有商业模式的时候,它留住顶级创新者的能力就会自然衰退。这不只是一个谷歌的问题——OpenAI 自己也在快速变大,也在面临同样的张力。

Shazeer 的下一站在 OpenAI,这个故事还远远没有结束。我个人的判断是,接下来的几个月里,OpenAI 的技术路线图很可能会出现一些我们没有预料到的新变量。一个被拒绝过聊天机器人发布的人,一个亲手发明了 Transformer 和 MoE 的人,一个在2026年当选美国国家工程院院士的人——他的加入,对 OpenAI 来说可能不只是一个顶尖人才的补充,而是一次技术灵魂的重塑。

至于这场顶流争夺战背后的另一个输家——Character.AI,这家曾经炙手可热的独角兽正在经历创始团队核心人物的全面离场。27亿美元的赎身费换来了 Shazeer 的回归,却没能换来他的长期留守。AI 创业公司的命运起伏,大概从来没有这么浓缩而剧烈过。

这个行业的故事,永远比任何剧本都更敢写。

© 版权声明

相关文章

暂无评论

暂无评论...

网址设置

网址样式切换

详细

网址卡片按钮

显示

布局设置

左侧边栏菜单

展开

页面最大宽度

1700px

搜索框设置

搜索框背景上下位置

仅对图片背景生效

50%

自定义搜索框背景

  • 静图

    随机壁纸

  • 静图

    随机4K

自定义搜索框高度

  • 聚焦
  • 信息
  • 默认
设置