把AI塞进诊室,喊了好几年,真正拿得出手的临床证据寥寥。但波士顿儿童医院、哈佛大学和OpenAI联手做了一件有点意思的事:他们把OpenAI o3 Deep Research推理模型当作"第二双眼睛",重新审视376例已经被专家反复分析过、却始终没找到答案的罕见病案例。结果令人侧目——在18例中,临床医生根据模型输出的证据链完成了诊断,额外诊断率达到4.8%。这批病例可不是什么冷门数据库里的边角料,而是顶级儿童医院多年来束手无策的硬骨头。
o3在这套工作流里干的活儿很克制:它不直接下诊断,更不替医生做决策,只是阅读患者的全部临床数据,整合文献、基因检测、影像报告,吐出一份基于证据的候选解释清单。拿到这份清单后,专家团队再启动评审、补充检测、临床验证。这套"AI提供假设、专家拍板"的模式,让原本零散、依赖灵感的病例复盘,变成了一套可以定期运行、规模化的流程。换句话说,AI的真正价值不在替代医生,而在把那些被遗忘在档案里的旧数据重新挖一遍——可能就藏着答案。
这项研究发表在《NEJM AI》,份量不轻。但4.8%这个数字也提醒我们,距离真正的临床落地还有相当距离。它验证的是一种工作方式,而非一个产品。不过对罕见病领域来说,每年新发的未诊病例堆积如山,任何能系统性降低误诊和漏诊的工具都值得认真对待。AI当不了诊断书上的签名,但它能成为专家手里那把更锋利的铲子。

