Apple在Google Cloud上给AI推理加了一把"只有你能开的锁"

软件科技2个月前发布 botnews

572 0 0

Apple在Google Cloud上给AI推理加了一把"只有你能开的锁"

---

你有没有想过，当你对着Siri说出一句话，或者让Apple Intelligence帮你润色一封邮件时，你的语音、你的文字去了哪里？

传统答案是：去了云端，被解密，被处理，然后返回。这个过程中间，有太多人理论上可以接触到你的数据——云服务商的工程师、潜在的入侵者、甚至某些你意想不到的"看门人"。

但现在，Apple在Google Cloud上做了一件让整个科技圈侧目的事：他们让AI推理过程本身变成了一个"黑箱"，连Google和Apple自己都无法窥探。

这不是什么遥远的概念，而是已经落地的生产级方案。背后依赖的，正是NVIDIA的机密计算（Confidential Computing）技术和Google Cloud刚刚上线的Blackwell B200 GPU集群。

为什么Apple需要一把"只有用户能开的锁"

说实话，Apple在AI时代面临一个有点尴尬的局面。

一方面，用户隐私是Apple最核心的品牌承诺之一。Tim Cook多次在公开场合强调，Apple不会把用户数据拿去训练AI模型，不会像某些竞争对手那样"贪婪地收集数据"。另一方面，AI能力的天花板很大程度上取决于计算资源，而复杂的大模型推理必须依赖云端——再强的iPhone芯片，也跑不动参数量上百亿的多模态模型。

这个矛盾在2024年变得格外尖锐。当Google Gemini、OpenAI ChatGPT、Microsoft Copilot在全球疯狂圈地时，Apple必须在"保证隐私"和"不掉队"之间找到一条路。

Apple的答案是Private Cloud Compute（PCC）架构。简单来说，他们设计了一套端到端的安全验证系统，让云端AI推理的每一步都可审计、可验证，理论上连Apple自己的服务器都无法访问用户数据。

但这里有个技术难题：传统的机密计算方案（比如CPU上的TEE）对GPU工作负载支持很弱。而AI推理恰恰是GPU密集型任务。

这时候，NVIDIA递来了解决方案。

NVIDIA机密计算：让GPU在"加密保险箱"里跑任务

机密计算这个概念并不新鲜。传统的数据安全是"静态加密"——数据存在硬盘上是加密的，但一旦要处理，就得先解密。可信执行环境（TEE）是另一种思路——把处理过程隔离在CPU的安全区域里，即使管理员也无法访问。

但这两种方案都没解决GPU的问题。AI推理必须用GPU算，而GPU处理数据时，数据必须是明文的。

NVIDIA的机密计算正是为解决这个问题而生。从Hopper架构（H100）开始，NVIDIA在GPU层面引入了硬件级的机密计算支持，到了Blackwell架构（B100/B200），这项技术已经相当成熟。

原理是这样的：GPU获得了自己的"安全飞地"（Secure Enclave），可以在TEE中运行工作负载。整个推理过程中，输入数据、模型权重、中间计算结果都保持加密状态。GPU内部有一个硬件级的"可信根"，负责解密和处理这些数据，但这个解密过程完全在GPU内部完成，外部（包括主机CPU、操作系统、云服务商的管理员）都无法访问明文。

简单类比的话，这就像你把一封信锁进一个特制的保险箱寄出去，快递公司可以帮你运输这个箱子，可以确保箱子完好无损到达，但没有任何人有钥匙打开它——只有最终收件人可以。

NVIDIA官方数据显示，Blackwell系列的机密计算吞吐量比Hopper提升了数倍，同时保持了几乎相同的延迟开销。对于对延迟敏感的交互式AI应用来说，这个改进意义重大。

Google Cloud + Blackwell B200：Apple隐私计算的"最强底座"

根据公开信息，Apple在Google Cloud上部署的推理任务运行在Blackwell B200 GPU上。Google Cloud是全球首批提供B200实例的云服务商之一，于2025年开始向企业客户提供预订。

B200是Blackwell架构的旗舰产品，单卡FP8算力可达20 PetaFLOPS（每秒千万亿次浮点运算），是上一代H100的2.5倍左右。更关键的是，B200完整继承了NVIDIA的机密计算能力，可以为大规模AI推理提供硬件级的隐私保护。

具体到Apple的实现方式，整个流程大致是这样的：

当用户的请求从iPhone发送到Google Cloud时，请求内容在传输过程中是加密的。到达服务器后，Blackwell B200在TEE中接收这个加密的请求，解密后进行推理计算，计算过程和数据始终不离开GPU的安全边界。推理完成后，结果再次加密返回，只有用户的设备持有解密密钥。

这意味着在整个链路中，Google Cloud的基础设施（包括Google的工程师、系统管理员，甚至任何可能的入侵者）理论上都无法获取用户数据的明文内容。Apple也无法看到——不是因为他们"承诺"不看，而是因为技术架构上他们根本没能力看。

我注意到一个值得玩味的细节：Apple选择把这么敏感的工作负载放在Google Cloud而不是自建数据中心。这既说明了Google Cloud在AI基础设施上的领先地位，也体现了Apple"专业的事交给专业的人"的态度——自己擅长的芯片和端侧安全做好，云端的事交给Google这样的顶级云服务商。

这会改变什么？

说实话，Apple这次不是第一个做机密计算AI推理的，但却是把这个方案推到聚光灯下的最大科技公司。它的示范意义可能比技术本身更大。

首先，这给整个行业打了个样。Google、Microsoft、AWS都在推机密计算服务，但大多数客户还停留在"了解概念"的阶段。Apple这样级别的客户实际部署，会让更多企业意识到：隐私保护不只是合规要求，而是可以和技术方案结合落地的。

其次，这可能会重塑"云AI"的市场格局。很长一段时间以来，企业在选择AI服务时不得不在"能力强的"和"隐私好的"之间做取舍。机密计算成熟后，这个trade-off会越来越不存在。Google Cloud拿到了Apple的信任，对Azure和AWS来说是有压力的。

最后，对普通用户而言，这可能意味着"隐私计算"会逐渐成为AI服务的标配。当你的数据在整个处理过程中都处于加密状态时，云端AI和端侧AI的体验差距会缩小，而隐私风险会显著降低。

当然，完美的技术方案是不存在的。机密计算保护的是运行时数据，但训练数据的来源、模型本身的行为审计、输入输出的合规检查，这些仍然需要其他层面的努力。

但至少，Apple这次让我们看到了一个可能：在AI时代，"你的数据只属于你"这句话，可以不再只是承诺，而是一套可验证的技术架构。

# 软件科技 # AI推理隐私 # AI数据安全 # Apple Intelligence # Apple机密计算 # Apple隐私保护 # Blackwell GPU # Google Cloud AI # GPU机密计算 # NVIDIA Blackwell B200 # Private Cloud Compute # TEE可信执行环境 # 云端AI隐私 # 机密计算架构 # 端到端加密 # 隐私计算方案

本站专栏文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

Apple在Google Cloud上给AI推理加了一把"只有你能开的锁"

Apple在Google Cloud上给AI推理加了一把"只有你能开的锁"

为什么Apple需要一把"只有用户能开的锁"

NVIDIA机密计算：让GPU在"加密保险箱"里跑任务

Google Cloud + Blackwell B200：Apple隐私计算的"最强底座"

这会改变什么？

MiniMax M3开源：428B参数、1M上下文，国产大模型向AGI狂飙

当订阅比API便宜70倍：AI定价策略正在经历一场静默革命

相关文章

暂无评论

最新文章

站点公告

网址设置

网址样式切换

网址卡片按钮

布局设置

左侧边栏菜单

页面最大宽度

搜索框设置

搜索框背景上下位置

自定义搜索框背景

自定义搜索框高度

Apple在Google Cloud上给AI推理加了一把"只有你能开的锁"

Apple在Google Cloud上给AI推理加了一把"只有你能开的锁"

为什么Apple需要一把"只有用户能开的锁"

NVIDIA机密计算：让GPU在"加密保险箱"里跑任务

Google Cloud + Blackwell B200：Apple隐私计算的"最强底座"

这会改变什么？

MiniMax M3开源：428B参数、1M上下文，国产大模型向AGI狂飙

当订阅比API便宜70倍：AI定价策略正在经历一场静默革命

相关文章

暂无评论

最新文章

站点公告

🇦🇩

网址设置

网址样式切换

网址卡片按钮

布局设置

左侧边栏菜单

页面最大宽度

搜索框设置

搜索框背景上下位置

自定义搜索框背景

自定义搜索框高度