从聊天框到数据中心:AI竞争进入「硬件为王」时代

软件科技1周前发布 botnews
265 0 0
从聊天框到数据中心:AI竞争进入「硬件为王」时代

从聊天框到数据中心AI竞争进入「硬件为王」时代

两年前,如果你问一位投资人哪家AI公司最强,答案通常是「OpenAI」或者「Anthropic」,紧接着就是关于GPT-4和Claude谁更强的热烈讨论。但今天,同样的问题,答案可能变成了「NvidiaH100还缺货吗」或者「微软在威斯康星的数据中心修到哪了」。

这个转变不是我一个人的观察。整个行业正在用脚投票:模型能力的差距在缩小,但部署能力的差距在拉大。AI战争的焦点,正在从「谁的大模型更聪明」转向「谁的 infrastructure 能让AI真正跑起来」。

模型军备竞赛:成绩斐然,但差距在收窄

过去两年,大模型领域的竞争堪称白热化。OpenAI发布GPT-4,Google推出Gemini Ultra,Anthropic的Claude 3在多项基准测试中刷新纪录,Meta开源Llama 3,马斯克 xAI 的Grok模型也挤进了战局。这场竞争确实推动了技术快速进步——2023年初还被认为是「天才」的GPT-4,到2024年底已经被许多从业者视为「基线」。

但问题在于,这种领先优势越来越难以维持。我个人判断,当各家模型在大多数场景下的表现都达到「够用」水平时,继续在基准测试上刷分带来的边际收益正在递减。用户不会因为某个模型的MMLU分数从85%提升到88%就换平台,但会因为响应速度慢或者API涨价而流失。

一个关键的数据点是:2024年下半年开始,各家大模型API的价格战愈演愈烈。OpenAI的GPT-4o mini将每百万token的成本降至几美分级别,Google的Gemini Flash更是以极低价格冲击市场。这意味着模型本身正在从「差异化壁垒」变成「标准化商品」。

硬件博弈:Nvidia的护城河与群狼环伺

如果说模型是AI的「大脑」,那算力就是「身体」。而这个身体的核心,目前由一家公司掌控——Nvidia。

2024年,Nvidia的数据中心业务营收突破600亿美元,其中AI相关收入占比超过80%。一块H100 GPU的价格约为3-4万美元,而且有钱还不一定买得到。据报道,微软、Meta、Google等公司为了确保芯片供应,与Nvidia签订了价值数十亿美元的长期协议。

但Nvidia的垄断正在被撬动。我观察到几个重要趋势:

首先是自研芯片的兴起。Google早在2020年就推出了TPU v4,并在内部大规模部署;亚马逊的Trainium芯片已经迭代到第二代;微软在2024年发布了Maia 100 AI芯片,并计划将其整合进Azure云服务;Meta也在开发自己的推理芯片。这些科技巨头的逻辑很直接:不再愿意把核心基础设施的命脉交给第三方。

其次是中国市场的特殊性。由于美国对华出口管制,中国公司无法获得最先进的Nvidia芯片。这反而催生了华为昇腾等国产芯片的发展,以及对算力优化的更强烈需求。

还有一个容易被忽视的数据:电力。国际能源署(IEA)的报告显示,数据中心用电量预计到2026年将翻倍,超过1000太瓦时。AI训练和推理的高密度计算,让电力成本成为比芯片成本更棘手的问题。OpenAI在训练GPT-4时消耗的电力,据说相当于数万个美国家庭的年用电量。这解释了为什么微软、Google、亚马逊都在疯狂签约清洁能源项目,甚至开始考虑核能——Microsoft甚至在2023年与核聚变初创公司Helion签署了购电协议。

推理时代:真正的主战场

训练一个大模型很贵,但推理更频繁、成本更高。我查了一些行业报告,有分析指出,对于一个已经部署的AI服务,推理成本通常是训练成本的5-10倍。这意味着,当模型训练完成、开始服务用户时,真正的烧钱机器才刚刚启动。

这个认知转变,正在重塑整个行业的投资方向。

ByteDance(字节跳动)是一个很好的观察样本。这家以TikTok闻名的公司,在AI领域的布局比很多人想象的更深。据报道,字节跳动已经在其推荐系统中大规模部署AI模型,服务着全球数十亿用户。与其花大价钱调用外部API,字节跳动更倾向于自建推理基础设施——这既是成本考量,也是数据安全和延迟的要求。

类似的逻辑也在微软身上体现。Microsoft Copilot现在内嵌在Windows、Office、Bing等多个产品中,每天的调用量以亿计。如果每此调用都要经过OpenAI的API,成本将是一个天文数字。通过深度整合和优化,Microsoft正在把AI能力「消化」进自己的产品体系,减少对外部调用的依赖。

这让我想到一个判断:未来AI公司竞争的胜负手,可能不在于模型本身,而在于能否把推理成本降低到「几乎为零」的能力。谁能更高效地运行模型,谁就能以更低价格提供服务,谁就能获得更多用户,形成正向循环。

全球棋局:不同玩家的差异化策略

这场「从模型到机器」的转变,在全球范围内呈现出不同的面貌。

在美国,科技巨头和芯片厂商形成了紧密的共生关系。Nvidia提供算力,Microsoft、Google、Amazon提供云服务,OpenAI、Anthropic等提供模型能力,Inflection、AI21等提供差异化应用。这种分层生态让各方都能找到自己的位置,但也让整个系统对Nvidia产生了过度依赖。

在中国,情况有所不同。由于芯片管制,华为昇腾系列芯片成为中国AI公司的重要选择。百度在2024年发布了文心大模型4.0,并将其部署在自研芯片上;阿里云的通义千问也在快速迭代;商汤、科大讯飞等公司则在垂直场景中找到了生存空间。中国的AI竞争,可能比美国更早进入「应用驱动」阶段。

欧洲则显得有些尴尬。缺乏顶级的芯片公司和云服务商,欧洲AI公司很大程度上依赖美国的技术栈。但这也可能催生监管层面的反击——欧盟AI法案的出台,某种程度上是对技术主权焦虑的政策回应。

---

回头来看,这场转变的本质是什么?

我认为,是AI从「展示技术潜力」进入了「规模商业化」阶段。前者的核心问题是「能不能做到」,答案是肯定的;后者的核心问题是「能不能规模化、低成本地做到」,答案还在探索中。

模型是种子,硬件是土壤,推理效率是阳光和水分。没有好的土壤和适宜的环境,再好的种子也长不成参天大树。

接下来的竞争,不会再是「谁发布了更聪明的模型」这种激动人心的新闻头条,而是「谁在威斯康星的玉米地里建起了能容纳10万块GPU的数据中心」这种看起来不那么sexy、但实际上决定胜负的基础设施故事。

AI战争的新篇章,已经翻到了「机器」这一页。

© 版权声明

相关文章

暂无评论

暂无评论...

网址设置

网址样式切换

详细

网址卡片按钮

显示

布局设置

左侧边栏菜单

展开

页面最大宽度

1700px

搜索框设置

搜索框背景上下位置

仅对图片背景生效

50%

自定义搜索框背景

  • 静图

    随机壁纸

  • 静图

    随机4K

自定义搜索框高度

  • 聚焦
  • 信息
  • 默认
设置