AI看球"看得见"但"看不懂"：一项35000小时视频测试的警示

软件科技2个月前发布 botnews

539 0 0

AI看球"看得见"但"看不懂"：一项35000小时视频测试的警示

世界杯决赛的最后一分钟，当你听到解说员喊出"这是一个越位陷阱！他识破了对手的战术意图"时，你有没有想过——如果换成一个AI，它能说出同样的话吗？

最近，北卡罗来纳大学教堂山分校和美国东北大学联合发布了一项研究，给出了一个让业界颇为意外的回答：至少在现阶段，AI在体育比赛分析这件事上，"几乎靠猜"。

这个结论并非空穴来风。研究团队构建了一个名为SVI-bench的基准测试系统，用超过35000小时的职业体育比赛视频，对当前主流的大语言模型和视觉语言模型进行了一场近乎"全方位体检"。测试结果，给火热的AI行业泼了一盆冷水。

当AI遇见球场：一场"全科考试"的结果

这场测试可不是简单的"看图说话"。研究团队设计了多个维度的考核，从基础到高阶，试图全面评估AI理解体育比赛的能力。

基础感知层面，AI的表现勉强及格。ChatGPT、谷歌Gemini、阿里千问等主流模型在识别比赛画面中的基本元素——比如球员位置、球权归属、得分情况——时，平均准确率约为74%。换句话说，如果你让AI看一段比赛录像然后回答"现在比分是多少"，它大概能答对七成。

但一旦题目进入需要因果推理的范畴，AI的成绩就出现了断崖式下跌。什么叫因果推理？比如"为什么这个角球战术成功了"或者"对手这次进攻受阻的根本原因是什么"。在这个维度上，主流AI模型的平均成功率只有40%左右。研究人员用了相当长的篇幅来描述测试过程：他们让AI观看完整的进攻回合，然后要求它解释战术的执行逻辑。结果显示，AI频繁出现"知其然不知其所以然"的情况——它能复述发生了什么，却很难说清楚"为什么发生"。

更让人啼笑皆非的是预测类题目。研究团队设计了一个测试环节，要求AI模拟球员在特定场景下的下一步行动。说实话，这个测试有点"为难"AI的意思，但结果依然令人意外：AI的表现"接近随机猜测"。这意味着什么？如果让AI预测梅西接下来会怎么带球，它的答案可能跟你闭着眼睛随便点一个选项差不多。

到了自主分析环节，情况更为严峻。研究人员给AI一段完整的比赛录像，不做任何提示，让它自己发现值得分析的内容并给出见解。结果，自主分析的准确率只有5%——这个数字低到几乎可以忽略不计。

说实话，看到这些数据的时候，我第一反应是有点意外的。毕竟这两年AI在医疗影像诊断、代码生成、文本写作等领域的表现有目共睹。为什么偏偏在体育比赛这种"直观"的视觉任务上摔了跟头？

为什么AI"看得见"却"看不懂"

要理解这个现象，我们得先搞清楚AI在看体育比赛时到底在"看"什么。

当前的AI视觉模型，包括那些被包装成"多模态大模型"的家伙，本质上擅长的是模式识别。它能识别画面里的球员、能追踪球的轨迹、能分辨出这是一个角球还是界外球。但这些能力，说到底还是"感知"层面的东西——就像一个人能看见黑板上的字，却不一定理解老师讲的物理定律。

体育比赛之所以难以被AI理解，核心问题在于战术的因果链条。一场足球比赛中的"造越位"战术，涉及至少三个层面的信息：对手球员的站位习惯、主裁判的判罚尺度倾向、本方防线整体的协调时机。这些信息分散在漫长的比赛进程中，有些甚至存在于球员的身体记忆和临场直觉里。AI很难把这些碎片信息串联成一个完整的因果逻辑链。

更关键的是，人类的体育解说需要"即时叙事"能力。解说员在评论一场比赛时，实际上是在做一件极其复杂的事情：一边接收实时信息，一边在极短的时间内完成"感知-理解-重构-表达"的全流程。他需要调动自己对这项运动的专业知识、对球队历史和球员特点的了解、以及对当下比赛节奏的判断。

AI目前显然做不到这一点。它可以事后分析一场比赛录像，给出一份看起来还算专业的报告，但在实时性和叙事性这两个关键维度上，表现都相当勉强。

这也解释了为什么AI在基础感知任务上能达到74%的准确率——那毕竟是它的"本职工作"。但在需要深层理解的领域，准确率就开始跳水。

体育解说员，暂时可以安心

这项研究的结论，对体育解说行业来说，算是一个让人松一口气的消息。

我注意到研究中有句话很有意思："AI仅擅长描述画面，无法解释战术为何成功或预判后续发展。"这个判断相当精准。当你在深夜看球，听到解说员说出"这个换人调整立竿见影"或者"对手明显加强了中场逼抢，这是要搏命的信号"时，这种基于经验、直觉和对比赛走势的判断，短期内AI很难复制。

但我觉得，研究团队之所以选择体育比赛作为测试场景，恐怕不仅仅是为了"为难"AI。体育比赛是一个相对封闭、可量化、信息结构清晰的场景。如果AI在这个领域都表现欠佳，那它的通用理解能力恐怕还要打上一个大大的问号。

换个角度想，这项研究也给AI应用泼了一点冷水。在媒体和资本的双重推动下，AI似乎已经"无所不能"了。但具体到某些垂直领域、某些需要深度推理和因果判断的任务上，当前的技术依然存在明显的边界。

写在最后

回到开头的问题：AI什么时候能取代体育解说员？

我的判断是，至少在五年内，这个担心是多余的。体育解说之所以打动观众，不仅在于信息的传递，更在于解说员作为"陪伴者"的角色——他的情绪、他的专业积累、他与观众之间建立的情感连接，这些都是AI难以复制的特质。

当然，AI并非没有用武之地。在数据统计、战术板分析、历史数据对比这些"体力活"上，AI可以成为解说员的好帮手。但真正考验临场判断力和叙事能力的那部分，暂时还是人类解说员的专属领地。

这项研究让我想起一句老话：人工智能，有时候更像是"人工智障"。在它真正"懂"这个世界之前，我们或许应该对它的能力边界保持清醒的认知。

# 软件科技 # AI体育分析 # AI感知能力 # ChatGPT # Gemini # SVI-bench # 人工智能 # 体育比赛分析 # 体育解说 # 千问 # 因果推理 # 基准测试 # 多模态大模型 # 大语言模型 # 战术理解 # 视觉语言模型

本站专栏文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

AI看球"看得见"但"看不懂"：一项35000小时视频测试的警示

AI看球"看得见"但"看不懂"：一项35000小时视频测试的警示

当AI遇见球场：一场"全科考试"的结果

为什么AI"看得见"却"看不懂"

体育解说员，暂时可以安心

写在最后

当AI开始主动“提问题”：MIT团队如何重新定义科学发现的边界

AI芯片暗战：Anthropic挖角OpenAI工程师背后的IPO冲刺

相关文章

暂无评论

最新文章

站点公告

网址设置

网址样式切换

网址卡片按钮

布局设置

左侧边栏菜单

页面最大宽度

搜索框设置

搜索框背景上下位置

自定义搜索框背景

自定义搜索框高度

AI看球"看得见"但"看不懂"：一项35000小时视频测试的警示

AI看球"看得见"但"看不懂"：一项35000小时视频测试的警示

当AI遇见球场：一场"全科考试"的结果

为什么AI"看得见"却"看不懂"

体育解说员，暂时可以安心

写在最后

当AI开始主动“提问题”：MIT团队如何重新定义科学发现的边界

AI芯片暗战：Anthropic挖角OpenAI工程师背后的IPO冲刺

相关文章

暂无评论

最新文章

站点公告

🇦🇩

网址设置

网址样式切换

网址卡片按钮

布局设置

左侧边栏菜单

页面最大宽度

搜索框设置

搜索框背景上下位置

自定义搜索框背景

自定义搜索框高度