
当AI开始读懂那些"疑难杂症":o3 Deep Research改写罕见病确诊史
说起来,罕见病大概是医学领域最残忍的谜题之一。
它残忍,不在于无药可治,而在于明明已经病了,却连病名都找不到。我之前写过一篇文章聊这个话题,说罕见病患者平均需要经历5年以上、辗转七八家医院才能获得确诊。这个数字背后是多少个家庭的深夜焦虑、多少次误诊后的身心俱疲,我至今想起来都觉得沉重。
但最近读到的一项研究,让我对这件事的态度发生了一点微妙的转变——是好的那种转变。
OpenAI与波士顿儿童医院、哈佛大学的研究团队合作,在医学顶刊NEJM AI上发表了一项成果:他们用o3 Deep Research重新审视了376例此前未能确诊的罕见儿科疾病案例,最终帮助找到了18种新诊断。
376例,18种新诊断。 这个数字猛一看不算惊人,但你仔细想想——这18个家庭,等这个答案等了多久?
一个等了19年的答案
研究里提到一个具体的案例,我看了之后久久没能忘掉。
一个名叫Kyra的女孩,从9岁起就出现了肌无力的症状。这种肌无力不是那种“累了歇歇就好”的疲软,而是一种进行性的、不断恶化的力量流失。她的家人带着她跑了不知道多少医院,做了不知道多少次检查,每一次都抱着“这次应该能查出来”的期待,每一次都落空。
这种漫长的等待是什么感觉?我没有亲身经历过,但我想象过——大概就像你一直听到楼上有脚步声,却永远等不到那个人下来。你知道有什么东西在那里,但它就是不肯露出真面目。
Kyra就这样等了将近20年。直到28岁生日前不久,基因检测和病理分析终于给出了答案:这是一种罕见的肌原纤维肌病( myofibrillar myopathy)。肌原纤维肌病是一类以肌纤维内蛋白质异常聚集为特征的遗传性肌病,通常由基因突变引起,临床表现以进行性肌无力和萎缩为主。这个诊断来得迟,但它确实来了。
说实话,19年的等待,换来一个“终于知道是什么病”的答案——这听起来有点荒诞,但在罕见病的世界里,这已经是幸运的结局了。
Deep Research凭什么能发现人类没发现的东西?
好,接下来一个很自然的问题是:这些案例之前难道没有专家看过吗?为什么o3 Deep Research能发现新诊断?
这就涉及到o3这个模型的一个核心能力了——深度推理和跨领域知识整合。
Deep Research模式的核心逻辑,简单说就是让AI像一个真正的人类研究员一样,先制定研究计划,再大规模检索文献,然后交叉比对病例数据,最后形成有据可查的报告。它的特别之处在于,罕见病诊断最需要的恰恰就是这种“地毯式搜索+跨学科关联”的能力。
一个罕见病案例之所以长期悬而未决,往往不是因为数据不够,而是因为数据太分散——症状可能涉及神经科、遗传科、免疫科等多个领域,而负责诊断的医生受限于专业分工和精力,很难同时在十几个数据库里交叉检索成百上千篇文献。o3 Deep Research做的事,本质上是把人类专家需要数周甚至数月才能完成的文献梳理和假设验证,压缩到了更短的时间内。
研究团队的方法论也值得关注。他们没有让AI单独完成诊断,而是建立了一个人机协作流程:AI提供分析和建议,最终由人类医生做出临床判断和确认。这种模式我觉得是当下AI医疗应用里最理性的路径——AI负责“想到”,人类负责“定夺”,两者各展所长。
18个诊断背后,是一个正在被撬动的系统
数据不会说谎,但数据背后的意义需要人去解读。
376个案例中确诊18种,确诊率大约4.8%。这个数字高不高?我觉得要分怎么看。从绝对数字来说,每确诊一例,都是一个家庭的重大转折;但从比例来看,还有超过95%的案例悬而未决——这说明罕见病诊断的难度依然是巨大的,AI目前能做的更多是辅助加速,而不是替代人类解决所有问题。
但更重要的是,这项研究的影响可能远超18个诊断本身。
波士顿儿童医院是美国最顶尖的儿科医院之一,哈佛大学的医学研究团队更是顶级配置。他们愿意在NEJM AI这样的权威期刊上发表合作成果,本身就释放了一个信号:AI在医学诊断领域的应用正在从实验阶段走向临床验证阶段。这不是PPT里的畅想,而是真实发表在学术期刊上的数据。
我注意到,这项研究还特别强调了数据隐私和伦理审查的规范流程。在罕见病研究里,患者数据的脱敏处理和知情同意一直是敏感议题。研究团队在这方面的谨慎态度,我认为是对的方向——技术跑得太快,伦理的轮子不能落下。
我们离AI“读懂”疾病还有多远?
写到最后,我想稍微跳出来聊一个更大的问题。
o3 Deep Research帮助确诊18种罕见病,这当然是个好消息。但它让我思考的是:AI在医疗领域的天花板在哪里?
我的判断是,目前的AI诊断本质上还是“模式匹配”——它擅长在海量文献和数据中找到关联,但它无法替代床边问诊中对患者状态的观察,无法感受一个家庭在等待中的焦灼,也无法在信息不完整时凭借经验和直觉做出“冒险”的临床判断。
这不是贬低AI,恰恰相反,这是对AI能力边界的清醒认知。
Kyra的故事之所以打动我,不只是因为她终于确诊了,更因为在这个过程中,技术最终服务于一个具体的、有名字的人。376个案例、18个诊断,每一个数字背后都是一个真实的人、一段真实的等待。
从这个角度看,AI在罕见病领域的价值或许不只是“提高诊断效率”这么简单。它更深刻的意义在于——它正在把那些被主流医疗体系忽略的声音,重新纳入视野。那些“查不出来”的病,不是因为不存在,而是因为没有被足够多的人看见。AI让这些沉默的案例有了被看见的可能。
罕见病群体的路还很长,但从这项研究开始,我相信更多被遗忘的“Kyra”会慢慢找到属于自己的答案。而这,大概就是技术在人性维度上最诚实的意义。
