拖动LOGO到书签栏,立即收藏本站

标签:ALE基准

当AI智能体撞上“天花板”:GPT-5.5登顶背后,最难任务0%成功率意味着什么

当AI智能体撞上“天花板”:GPT-5.5登顶背后,最难任务0%成功率意味着什么 说实话,看到这条新闻的时候,我愣了好几秒。 OpenAI研究员诺姆·布朗(Noam Brown)...