当开源社区的首页被"N"字母占领

引子：从"美国的开源回来了"说起

我刷到这条推文的时候，停下来想了好几秒。Natolambert 贴出的截图很清楚：HuggingFace 首页前 30 个模型里，有 9 个标注着 Nvidia 的名字。美国开源回来了——这句话从一个普通开发者的嘴里说出来，分量比任何厂商发布会都重。

说实话，我一开始以为这是某种巧合，或者说某种阶段性的流量波动。但仔细看了一眼时间线和后续讨论，我发现这不是偶然。HuggingFace 作为一个完全中立的模型托管平台，它的首页推荐逻辑是公开透明的——没有任何商业推广位，纯粹根据热度、下载量和社区活跃度排列。换句话说，这 9 个位置是开发者们一个一个点击出来的、一次一次 git clone 出来的。我个人判断，Nvidia 正在用一种很多人还没完全看透的方式，重写 AI 时代的游戏规则。

慢变量终于等来了爆点

那句 "Slowly, then suddenly" 是海明威最早用来形容破产的，但在科技圈它几乎成了技术拐点的标准描述。CUDA 就是最好的例子。2006 年 Nvidia 推出 CUDA 的时候，整个行业几乎没有人觉得这是什么大事。那时候 GPU 还在游戏和图形渲染的小圈子里打转，科学计算市场小得可怜。我记得看过一些老资料，当时 Nvidia 的工程师去学术会议做分享，台下经常只有几十个人。但正是这十七年近乎固执的生态培育，让 CUDA 今天成了 GPU 通用计算的工业标准。

回头看 2024 到 2026 年这两年，Nvidia 的开源动作突然密集起来了。2024 年 6 月他们开源了 NeMo Framework，这是一套涵盖数据处理、训练、微调的完整工具链。同年他们还放出了 Command R 系列模型，这是与 Cohere 合作的企业级 RAG 模型，在 HuggingFace 上的下载量很快突破了数百万次。进入 2025 年，Nvidia 的开源节奏明显加速——Nemotron 系列推理模型发布，NV-Embed v2 刷新了向量检索的评测榜单，紧接着 NV-Rerank 模型也上架了。就在这个月，Nvidia 又开源了 APES（Any Point EmbeddingS）模型，在多语言向量检索任务上取得了业界领先的成绩。

所以当 HuggingFace 的首页出现 9 个 Nvidia 模型的时候，这不是一周之内发生的事。这是十七年慢变量的集中兑现，是一个被长期低估的叙事终于被市场看见的过程。

HuggingFace 成了一个晴雨表

HuggingFace 这家公司很有意思。它最初只是一群工程师做的聊天机器人 demo，后来变成了全球最大的开源 AI 模型托管平台。截至 2025 年底，平台上的模型总数已经超过 100 万个，覆盖从 1 亿参数到上千亿参数的各类模型。每天有数以百万计的开发者在这里 pipeline 自己的 AI 应用。

它首页的推荐机制很关键。根据 HuggingFace 官方博客和社区文档，首页模型排序主要依据三个维度：近期下载量增长趋势、模型卡片完善度（文档、许可协议、示例代码）、以及社区互动指标。这套逻辑意味着一个模型想上首页，没有捷径，只能靠硬实力被社区认可。

所以当 9 个 Nvidia 模型同时出现在前 30 名时，这个数字本身就是一种宣言。我特意翻了一下 HuggingFace 的趋势页面，这 9 个模型覆盖了不同的任务类型——既有通用对话模型，也有专门针对向量检索和重排序优化的 embedding 模型，还有针对特定行业场景微调的版本。Nvidia 不是在某个单一赛道刷榜，而是在整个模型生态的多个关键节点上同时建立了存在感。

硬件厂商做开源，这事没那么简单

我相信很多人看到 Nvidia 开源模型，第一反应是"它不是卖 GPU 的吗，做开源模型图什么"。这个问题我问过自己很多遍，现在有一些相对清晰的答案。

第一层，开发者心智的占领。 当开发者习惯了一个模型框架的使用方式、API 设计和工具链生态之后，切换成本是非常高的。Nvidia 通过开源 NeMo、Megatron 等训练框架，已经让大量研究团队在 Nvidia 的工具链上跑了多年的实验。这批人换硬件的意愿天然就低。

第二层，软硬协同的闭环优化。 这是我觉得最值得注意的一点。Nvidia 开源的模型从设计阶段就是针对自家 GPU 架构优化的，特别是 Tensor Core 和 Transformer Engine 的使用方式。当你在 H100 或 B200 上跑这些模型，性能表现往往比跑其他开源模型高出一截。这种"软硬一体"的体验，是 AMD GPU 和英特尔 GPU 很难复制的优势。

第三层，企业市场的渗透。 去年 SAP 宣布与 Nvidia 合作，将开源模型能力整合到企业 ERP 流程中；Mistral 的一些模型也专门针对 Nvidia 平台做了推理优化。我个人判断，企业市场将是 Nvidia 开源策略最大的受益场景——企业不需要从零训练，只需要下载、微调、部署，而整个流程 Nvidia 都提供了免费但绑定自家硬件的工具。

竞争者们现在什么处境

当然，Nvidia 的高歌猛进不是没有对手。AMD 的 ROCm 生态在过去两年有了明显进步，MI300X 在某些大模型推理任务上的性价比已经开始威胁 Nvidia 的 H100。英特尔也在通过 oneAPI 和 Gaudi 加速器尝试切入这个市场。Google 的 TPU 虽然不卖硬件，但它的 JAX 生态和张量处理单元在自研模型训练上依然有不可忽视的成本优势。

但坦率地讲，在开源模型生态这个维度上，Nvidia 的领先优势比我预期的要大。HuggingFace 作为一个中立的第三方平台，它的选择本身就说明了问题。开发者用脚投票的结果，比任何一篇厂商新闻稿都可信。

开源模型的质量也在快速追赶。Llama 3、Mistral、Nemotron 这些模型在多个 benchmark 上的表现已经接近 GPT-4 级别，而且它们完全开源可商用。当最好的开源模型恰好跑在最好的开源硬件优化上，这个组合就形成了一个很难打破的正向循环。

结语

Nvidia 在 HuggingFace 拿下 9/30 的位置，我不认为这是一个终点，更像是一个标志性的中间站。从 CUDA 到 cuDNN，从 Megatron 到 NeMo，从硬件垄断到生态渗透，Nvidia 用一种极其有耐心的方式完成了从"显卡公司"到"AI 基础设施公司"的跃迁。而开源模型的涌入，让这个故事多了一个人人可参与的维度。

未来几年，我个人比较关注的是：这个"9/30"的数字会不会继续扩大，以及当 Nvidia 的开源模型生态足够成熟的时候，它会不会对闭源模型厂商形成实质性的竞争压力。说实话，这个趋势才刚刚开始，HuggingFace 首页上的那 9 个"N"字，可能只是序幕。

# 软件科技 # AI模型 # CUDA # GPU通用计算 # HuggingFace # NeMo # Nvidia # Tensor Core # Transformer Engine # 向量检索 # 开发者生态 # 开源模型 # 模型托管 # 深度学习 # 软硬协同

本站专栏文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

当开源社区的首页被"N"字母占领

当开源社区的首页被"N"字母占领

引子：从"美国的开源回来了"说起

慢变量终于等来了爆点

HuggingFace 成了一个晴雨表

硬件厂商做开源，这事没那么简单

竞争者们现在什么处境

结语

商汤的差异化战法：当中国AI开始讲“业务成果”这门语言

AI正在成为第11大耗电国：我们每天向它倾倒多少自然资源？

相关文章

暂无评论

最新文章

站点公告

网址设置

网址样式切换

网址卡片按钮

布局设置

左侧边栏菜单

页面最大宽度

搜索框设置

搜索框背景上下位置

自定义搜索框背景

自定义搜索框高度

当开源社区的首页被"N"字母占领

当开源社区的首页被"N"字母占领

引子：从"美国的开源回来了"说起

慢变量终于等来了爆点

HuggingFace 成了一个晴雨表

硬件厂商做开源，这事没那么简单

竞争者们现在什么处境

结语

商汤的差异化战法：当中国AI开始讲“业务成果”这门语言

AI正在成为第11大耗电国：我们每天向它倾倒多少自然资源？

相关文章

暂无评论

最新文章

站点公告

🇦🇩

网址设置

网址样式切换

网址卡片按钮

布局设置

左侧边栏菜单

页面最大宽度

搜索框设置

搜索框背景上下位置

自定义搜索框背景

自定义搜索框高度