
当开源社区的首页被"N"字母占领
引子:从"美国的开源回来了"说起
我刷到这条推文的时候,停下来想了好几秒。Natolambert 贴出的截图很清楚:HuggingFace 首页前 30 个模型里,有 9 个标注着 Nvidia 的名字。美国开源回来了——这句话从一个普通开发者的嘴里说出来,分量比任何厂商发布会都重。
说实话,我一开始以为这是某种巧合,或者说某种阶段性的流量波动。但仔细看了一眼时间线和后续讨论,我发现这不是偶然。HuggingFace 作为一个完全中立的模型托管平台,它的首页推荐逻辑是公开透明的——没有任何商业推广位,纯粹根据热度、下载量和社区活跃度排列。换句话说,这 9 个位置是开发者们一个一个点击出来的、一次一次 git clone 出来的。我个人判断,Nvidia 正在用一种很多人还没完全看透的方式,重写 AI 时代的游戏规则。
慢变量终于等来了爆点
那句 "Slowly, then suddenly" 是海明威最早用来形容破产的,但在科技圈它几乎成了技术拐点的标准描述。CUDA 就是最好的例子。2006 年 Nvidia 推出 CUDA 的时候,整个行业几乎没有人觉得这是什么大事。那时候 GPU 还在游戏和图形渲染的小圈子里打转,科学计算市场小得可怜。我记得看过一些老资料,当时 Nvidia 的工程师去学术会议做分享,台下经常只有几十个人。但正是这十七年近乎固执的生态培育,让 CUDA 今天成了 GPU 通用计算的工业标准。
回头看 2024 到 2026 年这两年,Nvidia 的开源动作突然密集起来了。2024 年 6 月他们开源了 NeMo Framework,这是一套涵盖数据处理、训练、微调的完整工具链。同年他们还放出了 Command R 系列模型,这是与 Cohere 合作的企业级 RAG 模型,在 HuggingFace 上的下载量很快突破了数百万次。进入 2025 年,Nvidia 的开源节奏明显加速——Nemotron 系列推理模型发布,NV-Embed v2 刷新了向量检索的评测榜单,紧接着 NV-Rerank 模型也上架了。就在这个月,Nvidia 又开源了 APES(Any Point EmbeddingS)模型,在多语言向量检索任务上取得了业界领先的成绩。
所以当 HuggingFace 的首页出现 9 个 Nvidia 模型的时候,这不是一周之内发生的事。这是十七年慢变量的集中兑现,是一个被长期低估的叙事终于被市场看见的过程。
HuggingFace 成了一个晴雨表
HuggingFace 这家公司很有意思。它最初只是一群工程师做的聊天机器人 demo,后来变成了全球最大的开源 AI 模型托管平台。截至 2025 年底,平台上的模型总数已经超过 100 万个,覆盖从 1 亿参数到上千亿参数的各类模型。每天有数以百万计的开发者在这里 pipeline 自己的 AI 应用。
它首页的推荐机制很关键。根据 HuggingFace 官方博客和社区文档,首页模型排序主要依据三个维度:近期下载量增长趋势、模型卡片完善度(文档、许可协议、示例代码)、以及社区互动指标。这套逻辑意味着一个模型想上首页,没有捷径,只能靠硬实力被社区认可。
所以当 9 个 Nvidia 模型同时出现在前 30 名时,这个数字本身就是一种宣言。我特意翻了一下 HuggingFace 的趋势页面,这 9 个模型覆盖了不同的任务类型——既有通用对话模型,也有专门针对向量检索和重排序优化的 embedding 模型,还有针对特定行业场景微调的版本。Nvidia 不是在某个单一赛道刷榜,而是在整个模型生态的多个关键节点上同时建立了存在感。
硬件厂商做开源,这事没那么简单
我相信很多人看到 Nvidia 开源模型,第一反应是"它不是卖 GPU 的吗,做开源模型图什么"。这个问题我问过自己很多遍,现在有一些相对清晰的答案。
第一层,开发者心智的占领。 当开发者习惯了一个模型框架的使用方式、API 设计和工具链生态之后,切换成本是非常高的。Nvidia 通过开源 NeMo、Megatron 等训练框架,已经让大量研究团队在 Nvidia 的工具链上跑了多年的实验。这批人换硬件的意愿天然就低。
第二层,软硬协同的闭环优化。 这是我觉得最值得注意的一点。Nvidia 开源的模型从设计阶段就是针对自家 GPU 架构优化的,特别是 Tensor Core 和 Transformer Engine 的使用方式。当你在 H100 或 B200 上跑这些模型,性能表现往往比跑其他开源模型高出一截。这种"软硬一体"的体验,是 AMD GPU 和英特尔 GPU 很难复制的优势。
第三层,企业市场的渗透。 去年 SAP 宣布与 Nvidia 合作,将开源模型能力整合到企业 ERP 流程中;Mistral 的一些模型也专门针对 Nvidia 平台做了推理优化。我个人判断,企业市场将是 Nvidia 开源策略最大的受益场景——企业不需要从零训练,只需要下载、微调、部署,而整个流程 Nvidia 都提供了免费但绑定自家硬件的工具。
竞争者们现在什么处境
当然,Nvidia 的高歌猛进不是没有对手。AMD 的 ROCm 生态在过去两年有了明显进步,MI300X 在某些大模型推理任务上的性价比已经开始威胁 Nvidia 的 H100。英特尔也在通过 oneAPI 和 Gaudi 加速器尝试切入这个市场。Google 的 TPU 虽然不卖硬件,但它的 JAX 生态和张量处理单元在自研模型训练上依然有不可忽视的成本优势。
但坦率地讲,在开源模型生态这个维度上,Nvidia 的领先优势比我预期的要大。HuggingFace 作为一个中立的第三方平台,它的选择本身就说明了问题。开发者用脚投票的结果,比任何一篇厂商新闻稿都可信。
开源模型的质量也在快速追赶。Llama 3、Mistral、Nemotron 这些模型在多个 benchmark 上的表现已经接近 GPT-4 级别,而且它们完全开源可商用。当最好的开源模型恰好跑在最好的开源硬件优化上,这个组合就形成了一个很难打破的正向循环。
结语
Nvidia 在 HuggingFace 拿下 9/30 的位置,我不认为这是一个终点,更像是一个标志性的中间站。从 CUDA 到 cuDNN,从 Megatron 到 NeMo,从硬件垄断到生态渗透,Nvidia 用一种极其有耐心的方式完成了从"显卡公司"到"AI 基础设施公司"的跃迁。而开源模型的涌入,让这个故事多了一个人人可参与的维度。
未来几年,我个人比较关注的是:这个"9/30"的数字会不会继续扩大,以及当 Nvidia 的开源模型生态足够成熟的时候,它会不会对闭源模型厂商形成实质性的竞争压力。说实话,这个趋势才刚刚开始,HuggingFace 首页上的那 9 个"N"字,可能只是序幕。
