OpenAI 做了一件挺狠的事:把原本只对付费推理模型开放的前沿健康 AI 能力,搬进了所有人免费能用的 GPT-5.5 Instant。这不是一次常规迭代,而是 ChatGPT 健康功能的底层迁移——免费用户现在拿到的健康评估表现,已经逼近 Thinking 模型的水平。考虑到每周超过 2.3 亿人在 ChatGPT 上问健康问题,这个决策的分量比表面上看更重。
背后的技术路径是知识蒸馏。OpenAI 让一个更强的教师模型打头阵,再用 260 多名医生做"质检员"——这些医生覆盖 60 个国家、49 种语言、26 个专科,累计审查超过 70 万条模型响应。审查结果反哺学生模型,训练它学习临床场景下的回答模式。训练手段并不新鲜:监督微调加偏好训练双管齐下,重点打磨的是"不确定性下的行为"——症状没描述清楚就先追问,年龄没交代就先确认,而不是急着给一个看似完整但其实站不住脚的答案。
实际效果呢?OpenAI 拿真实健康流量做了对比,事实性错误直接砍掉 71%。这个数字在医疗语境里几乎是奢侈品级别的提升,意味着用户拿到的建议更可能靠谱、更少误导。GPT-5.5 Instant 已经面向全体免费用户开放,没有任何门槛。对那些把 ChatGPT 当"赛博医生"的人来说,免费版终于不再是一个将就的备胎。

