拖动LOGO到书签栏,立即收藏本站

标签:大语言模型推理

当MoE遇上TPU:一次让推理效率翻倍的技术跃迁

当MoE遇上TPU:一次让推理效率翻倍的技术跃迁 在大语言模型的世界里,效率就是生命线。 2026年的今天,稀疏专家混合(MoE)架构已经成为支撑千亿参数模型的事...