拖动LOGO到书签栏,立即收藏本站

标签:上下文长度

当注意力变成奢侈品:MiniMax如何让大模型"选择性失明"

当注意力变成奢侈品:MiniMax如何让大模型'选择性失明' 说实话,每次看到大模型处理超长上下文时那缓慢的输出速度,我都忍不住想——Transformer的核心注意力机...