AI看球"看得见"但"看不懂":一项35000小时视频测试的警示

软件科技2小时前发布 botnews
81 0 0
AI看球

AI看球"看得见"但"看不懂":一项35000小时视频测试的警示

世界杯决赛的最后一分钟,当你听到解说员喊出"这是一个越位陷阱!他识破了对手的战术意图"时,你有没有想过——如果换成一个AI,它能说出同样的话吗?

最近,北卡罗来纳大学教堂山分校和美国东北大学联合发布了一项研究,给出了一个让业界颇为意外的回答:至少在现阶段,AI在体育比赛分析这件事上,"几乎靠猜"。

这个结论并非空穴来风。研究团队构建了一个名为SVI-bench基准测试系统,用超过35000小时的职业体育比赛视频,对当前主流的大语言模型视觉语言模型进行了一场近乎"全方位体检"。测试结果,给火热的AI行业泼了一盆冷水。

当AI遇见球场:一场"全科考试"的结果

这场测试可不是简单的"看图说话"。研究团队设计了多个维度的考核,从基础到高阶,试图全面评估AI理解体育比赛的能力。

基础感知层面,AI的表现勉强及格。ChatGPT、谷歌Gemini、阿里千问等主流模型在识别比赛画面中的基本元素——比如球员位置、球权归属、得分情况——时,平均准确率约为74%。换句话说,如果你让AI看一段比赛录像然后回答"现在比分是多少",它大概能答对七成。

但一旦题目进入需要因果推理的范畴,AI的成绩就出现了断崖式下跌。什么叫因果推理?比如"为什么这个角球战术成功了"或者"对手这次进攻受阻的根本原因是什么"。在这个维度上,主流AI模型的平均成功率只有40%左右。研究人员用了相当长的篇幅来描述测试过程:他们让AI观看完整的进攻回合,然后要求它解释战术的执行逻辑。结果显示,AI频繁出现"知其然不知其所以然"的情况——它能复述发生了什么,却很难说清楚"为什么发生"。

更让人啼笑皆非的是预测类题目。研究团队设计了一个测试环节,要求AI模拟球员在特定场景下的下一步行动。说实话,这个测试有点"为难"AI的意思,但结果依然令人意外:AI的表现"接近随机猜测"。这意味着什么?如果让AI预测梅西接下来会怎么带球,它的答案可能跟你闭着眼睛随便点一个选项差不多。

到了自主分析环节,情况更为严峻。研究人员给AI一段完整的比赛录像,不做任何提示,让它自己发现值得分析的内容并给出见解。结果,自主分析的准确率只有5%——这个数字低到几乎可以忽略不计。

说实话,看到这些数据的时候,我第一反应是有点意外的。毕竟这两年AI在医疗影像诊断、代码生成、文本写作等领域的表现有目共睹。为什么偏偏在体育比赛这种"直观"的视觉任务上摔了跟头?

为什么AI"看得见"却"看不懂"

要理解这个现象,我们得先搞清楚AI在看体育比赛时到底在"看"什么。

当前的AI视觉模型,包括那些被包装成"多模态大模型"的家伙,本质上擅长的是模式识别。它能识别画面里的球员、能追踪球的轨迹、能分辨出这是一个角球还是界外球。但这些能力,说到底还是"感知"层面的东西——就像一个人能看见黑板上的字,却不一定理解老师讲的物理定律。

体育比赛之所以难以被AI理解,核心问题在于战术的因果链条。一场足球比赛中的"造越位"战术,涉及至少三个层面的信息:对手球员的站位习惯、主裁判的判罚尺度倾向、本方防线整体的协调时机。这些信息分散在漫长的比赛进程中,有些甚至存在于球员的身体记忆和临场直觉里。AI很难把这些碎片信息串联成一个完整的因果逻辑链。

更关键的是,人类的体育解说需要"即时叙事"能力。解说员在评论一场比赛时,实际上是在做一件极其复杂的事情:一边接收实时信息,一边在极短的时间内完成"感知-理解-重构-表达"的全流程。他需要调动自己对这项运动的专业知识、对球队历史和球员特点的了解、以及对当下比赛节奏的判断。

AI目前显然做不到这一点。它可以事后分析一场比赛录像,给出一份看起来还算专业的报告,但在实时性叙事性这两个关键维度上,表现都相当勉强。

这也解释了为什么AI在基础感知任务上能达到74%的准确率——那毕竟是它的"本职工作"。但在需要深层理解的领域,准确率就开始跳水。

体育解说员,暂时可以安心

这项研究的结论,对体育解说行业来说,算是一个让人松一口气的消息。

我注意到研究中有句话很有意思:"AI仅擅长描述画面,无法解释战术为何成功或预判后续发展。"这个判断相当精准。当你在深夜看球,听到解说员说出"这个换人调整立竿见影"或者"对手明显加强了中场逼抢,这是要搏命的信号"时,这种基于经验、直觉和对比赛走势的判断,短期内AI很难复制。

但我觉得,研究团队之所以选择体育比赛作为测试场景,恐怕不仅仅是为了"为难"AI。体育比赛是一个相对封闭、可量化、信息结构清晰的场景。如果AI在这个领域都表现欠佳,那它的通用理解能力恐怕还要打上一个大大的问号。

换个角度想,这项研究也给AI应用泼了一点冷水。在媒体和资本的双重推动下,AI似乎已经"无所不能"了。但具体到某些垂直领域、某些需要深度推理和因果判断的任务上,当前的技术依然存在明显的边界。

写在最后

回到开头的问题:AI什么时候能取代体育解说员?

我的判断是,至少在五年内,这个担心是多余的。体育解说之所以打动观众,不仅在于信息的传递,更在于解说员作为"陪伴者"的角色——他的情绪、他的专业积累、他与观众之间建立的情感连接,这些都是AI难以复制的特质。

当然,AI并非没有用武之地。在数据统计、战术板分析、历史数据对比这些"体力活"上,AI可以成为解说员的好帮手。但真正考验临场判断力和叙事能力的那部分,暂时还是人类解说员的专属领地。

这项研究让我想起一句老话:人工智能,有时候更像是"人工智障"。在它真正"懂"这个世界之前,我们或许应该对它的能力边界保持清醒的认知。

© 版权声明

相关文章

暂无评论

暂无评论...

网址设置

网址样式切换

详细

网址卡片按钮

显示

布局设置

左侧边栏菜单

展开

页面最大宽度

1700px

搜索框设置

搜索框背景上下位置

仅对图片背景生效

50%

自定义搜索框背景

  • 静图

    随机壁纸

  • 静图

    随机4K

自定义搜索框高度

  • 聚焦
  • 信息
  • 默认
设置