你大概刚从别的新闻里看到“SOTA”这个词,但这次,Anthropic把它塞进了一个听起来有点神话色彩的名字里,还顺手把价格砍了一半。他们今天端出了Claude Fable 5和Claude Mythos 5,一个号称通用安全版,一个叫受限安全版。这不像是一次常规更新,更像是一次精心策划的“危险品安全运输”演示——把最锐利的刀,套上了他们认为最可靠的鞘。
危险,但安全
这是此次发布最核心的悖论。Anthropic一直在用名字讲故事,“Fable”(寓言)和“Mythos”(神话)暗示着故事的复杂与深意。他们这次直接挑明了:这些模型在能力上已触及边界,但必须以不同的方式被约束和释放。
跑分屠榜,但不止于跑分
Stripe的反馈很直白,Fable 5把“数月工程压缩至数天”。在FrontierCode这类硬核编码基准上,它坐在了榜首。一个更直观的例子是,它能仅凭一张网页截图,反向工程出可运行的源代码。这不是微调,是场景重构能力。Mythos 5则在它擅长的领域更夸张:药物设计提速约10倍,其分子生物学假说在盲测中,获得科学家偏好的概率高达80%。性能飞跃,但代价是它们可能“知道”得太多。
安全,不是限制而是分区
为此,Anthropic搞了套“分级访问”策略。Fable 5是主力,在95%的无敏感话题对话中,你会跑在完整的满血版上。一旦触及5%的特定红线,系统会自动“回退”到更保守的Claude Opus 4.8。Mythos 5则通过名为“Project Glasswing”的项目,定向开放给网络安全防御者使用。这不是简单的“不回答”,而是构建了一个动态的、根据语境切换的“安全区”。模型的能力越强,围栏的建造方式就越精细。
价格腰斩,瞄准规模化
性能狂飙的同时,定价策略却来了个急转弯。Fable 5和Mythos 5的统一定价:每百万输入token 10美元,每百万输出token 50美元。这比前代旗舰Claude Mythos Preview降价超过一半。在AI模型成本居高不下的今天,这步棋走得意味深长。
不卖期货,卖生产力
直接降价,而非推出一个更便宜的“ lite ”版本,信号非常明确:Anthropic不想只让少数公司用得起尖端模型。他们瞄准的是能规模化、持续产生价值的“知识工作”和“软件工程”场景。当成本门槛降低,企业将更愿意将工作流深度集成。Stripe的案例就是最好的广告——如果真能省下几个月的人力,每百万token 50美元的输出成本,会迅速被吸收掉。
商业化路径清晰化
这一定价也暴露了Anthropic的野心:他们不仅要当技术引领者,还要成为关键的基础设施供应商。通过价格杠杆,推动模型从“实验性工具”变为“生产环境必选项”。尤其是Fable 5这种在通用任务上已接近或达到顶级的模型,半价策略会迅速冲击整个企业级AI服务的定价体系,其他玩家不得不跟进。
重写“能做”与“怎么做”
对于最终用户和开发者而言,这次发布改变的是预期。模型的能力天花板被再次抬高,但更关键的是,它提供了一种新的工作范式。
编码:从辅助到主导
“凭截图重建源码”这个能力,听起来像魔术,但它指向了一个更本质的变化:AI正在理解“意图”和“结构”,而不仅仅是补全代码片段。当工程任务可以被压缩,开发者的角色必然向更高层次的架构设计、需求定义和复杂问题拆解转移。Fable 5不是来当个更聪明的副驾驶的,它想证明自己能在很多路段上直接握住方向盘。
科研:加速假设验证循环
Mythos 5在科研领域的潜力更具颠覆性。加速药物设计10倍,意味着传统上需要数年筛选和验证的过程可能被压缩到数月。它提出的假说能被科学家高度认可,表明模型在特定专业领域已具备近乎“研究伙伴”级别的洞察力。这不仅仅是提升效率,它可能从根本上改变某些学科的探索节奏,让“计算先行,实验验证”的模式变得更加可行和主流。

