
Apple在Google Cloud上给AI推理加了一把"只有你能开的锁"
---
你有没有想过,当你对着Siri说出一句话,或者让Apple Intelligence帮你润色一封邮件时,你的语音、你的文字去了哪里?
传统答案是:去了云端,被解密,被处理,然后返回。这个过程中间,有太多人理论上可以接触到你的数据——云服务商的工程师、潜在的入侵者、甚至某些你意想不到的"看门人"。
但现在,Apple在Google Cloud上做了一件让整个科技圈侧目的事:他们让AI推理过程本身变成了一个"黑箱",连Google和Apple自己都无法窥探。
这不是什么遥远的概念,而是已经落地的生产级方案。背后依赖的,正是NVIDIA的机密计算(Confidential Computing)技术和Google Cloud刚刚上线的Blackwell B200 GPU集群。
为什么Apple需要一把"只有用户能开的锁"
说实话,Apple在AI时代面临一个有点尴尬的局面。
一方面,用户隐私是Apple最核心的品牌承诺之一。Tim Cook多次在公开场合强调,Apple不会把用户数据拿去训练AI模型,不会像某些竞争对手那样"贪婪地收集数据"。另一方面,AI能力的天花板很大程度上取决于计算资源,而复杂的大模型推理必须依赖云端——再强的iPhone芯片,也跑不动参数量上百亿的多模态模型。
这个矛盾在2024年变得格外尖锐。当Google Gemini、OpenAI ChatGPT、Microsoft Copilot在全球疯狂圈地时,Apple必须在"保证隐私"和"不掉队"之间找到一条路。
Apple的答案是Private Cloud Compute(PCC)架构。简单来说,他们设计了一套端到端的安全验证系统,让云端AI推理的每一步都可审计、可验证,理论上连Apple自己的服务器都无法访问用户数据。
但这里有个技术难题:传统的机密计算方案(比如CPU上的TEE)对GPU工作负载支持很弱。而AI推理恰恰是GPU密集型任务。
这时候,NVIDIA递来了解决方案。
NVIDIA机密计算:让GPU在"加密保险箱"里跑任务
机密计算这个概念并不新鲜。传统的数据安全是"静态加密"——数据存在硬盘上是加密的,但一旦要处理,就得先解密。可信执行环境(TEE)是另一种思路——把处理过程隔离在CPU的安全区域里,即使管理员也无法访问。
但这两种方案都没解决GPU的问题。AI推理必须用GPU算,而GPU处理数据时,数据必须是明文的。
NVIDIA的机密计算正是为解决这个问题而生。从Hopper架构(H100)开始,NVIDIA在GPU层面引入了硬件级的机密计算支持,到了Blackwell架构(B100/B200),这项技术已经相当成熟。
原理是这样的:GPU获得了自己的"安全飞地"(Secure Enclave),可以在TEE中运行工作负载。整个推理过程中,输入数据、模型权重、中间计算结果都保持加密状态。GPU内部有一个硬件级的"可信根",负责解密和处理这些数据,但这个解密过程完全在GPU内部完成,外部(包括主机CPU、操作系统、云服务商的管理员)都无法访问明文。
简单类比的话,这就像你把一封信锁进一个特制的保险箱寄出去,快递公司可以帮你运输这个箱子,可以确保箱子完好无损到达,但没有任何人有钥匙打开它——只有最终收件人可以。
NVIDIA官方数据显示,Blackwell系列的机密计算吞吐量比Hopper提升了数倍,同时保持了几乎相同的延迟开销。对于对延迟敏感的交互式AI应用来说,这个改进意义重大。
Google Cloud + Blackwell B200:Apple隐私计算的"最强底座"
根据公开信息,Apple在Google Cloud上部署的推理任务运行在Blackwell B200 GPU上。Google Cloud是全球首批提供B200实例的云服务商之一,于2025年开始向企业客户提供预订。
B200是Blackwell架构的旗舰产品,单卡FP8算力可达20 PetaFLOPS(每秒千万亿次浮点运算),是上一代H100的2.5倍左右。更关键的是,B200完整继承了NVIDIA的机密计算能力,可以为大规模AI推理提供硬件级的隐私保护。
具体到Apple的实现方式,整个流程大致是这样的:
当用户的请求从iPhone发送到Google Cloud时,请求内容在传输过程中是加密的。到达服务器后,Blackwell B200在TEE中接收这个加密的请求,解密后进行推理计算,计算过程和数据始终不离开GPU的安全边界。推理完成后,结果再次加密返回,只有用户的设备持有解密密钥。
这意味着在整个链路中,Google Cloud的基础设施(包括Google的工程师、系统管理员,甚至任何可能的入侵者)理论上都无法获取用户数据的明文内容。Apple也无法看到——不是因为他们"承诺"不看,而是因为技术架构上他们根本没能力看。
我注意到一个值得玩味的细节:Apple选择把这么敏感的工作负载放在Google Cloud而不是自建数据中心。这既说明了Google Cloud在AI基础设施上的领先地位,也体现了Apple"专业的事交给专业的人"的态度——自己擅长的芯片和端侧安全做好,云端的事交给Google这样的顶级云服务商。
这会改变什么?
说实话,Apple这次不是第一个做机密计算AI推理的,但却是把这个方案推到聚光灯下的最大科技公司。它的示范意义可能比技术本身更大。
首先,这给整个行业打了个样。Google、Microsoft、AWS都在推机密计算服务,但大多数客户还停留在"了解概念"的阶段。Apple这样级别的客户实际部署,会让更多企业意识到:隐私保护不只是合规要求,而是可以和技术方案结合落地的。
其次,这可能会重塑"云AI"的市场格局。很长一段时间以来,企业在选择AI服务时不得不在"能力强的"和"隐私好的"之间做取舍。机密计算成熟后,这个trade-off会越来越不存在。Google Cloud拿到了Apple的信任,对Azure和AWS来说是有压力的。
最后,对普通用户而言,这可能意味着"隐私计算"会逐渐成为AI服务的标配。当你的数据在整个处理过程中都处于加密状态时,云端AI和端侧AI的体验差距会缩小,而隐私风险会显著降低。
当然,完美的技术方案是不存在的。机密计算保护的是运行时数据,但训练数据的来源、模型本身的行为审计、输入输出的合规检查,这些仍然需要其他层面的努力。
但至少,Apple这次让我们看到了一个可能:在AI时代,"你的数据只属于你"这句话,可以不再只是承诺,而是一套可验证的技术架构。
