上周有三件事几乎同时发生,看起来毫不相干,串在一起却讲透了 AI 行业的下一个十年走向。美国政府切断了 Anthropic 对一款叫 Fable 的产品的访问权限;Salesforce 砸下 36 亿美元收购了前 Intercom 旗下的 Fin;而微软的 Satya Nadella 在一次闭门对话里说,未来 AI 真正的护城河不是模型,而是围绕模型搭建起来的那整套外围系统。再加上 VC Tomer Tunguz 在博客里抛出"AI 应用的黄金时代"这个判断——所有线索都指向同一个结论:AI 应用层正在成为主战场,而真正决定胜负的,是工程能力,不是模型权重。
三件事,三个信号
信号一:连政府客户都被"限流"了
Anthropic 关掉 Fable 访问这件事,被很多人忽略,但它释放的信号极其刺眼。当一家顶级模型公司开始主动限制外部产品的 API 访问,意味着它不再满足于只做底层供应商。Anthropic 想做应用、做 Agent、吃下更多利润空间——这和 OpenAI 推出 ChatGPT 企业版、Anthropic 自己做 Claude Code 是同一条逻辑。模型厂商和应用开发者之间的关系正在从"合作"滑向"竞合",任何把身家性命押在单一闭源 API 上的团队,今天就该醒醒了。开源模型和本地部署不是政治正确,是商业刚需。
信号二:36 亿美元,买的是"性价比"
Salesforce 收购 Fin 的价格让不少人困惑——一个年营收据说不到 1 亿美元的客户支持 AI 产品,凭什么值 36 亿?答案藏在 Fin 的技术栈里。它用开源模型替换了原本昂贵的前沿 API,把单次交互成本压到竞争对手的零头,同时保持服务质量不掉档。这笔收购买的不是客户、不是品牌,是一套"用便宜模型做出好产品"的工程方法论。Salesforce 赌的是:当模型本身越来越同质化,智能体系统的工程优化能力就是新的定价权。
信号三:Nadella 终于把话说透了
Satya Nadella 最近的表态值得逐字读一遍——AI 生态的护城河应该是人类的领域专业知识,以及模型外围的系统层。这话翻译成大白话:别再争论哪个模型更聪明了,真正值钱的是懂行业的人、懂业务流程的人,以及把模型嵌进真实工作流里的那一整套软件工程。微软自己就是这套逻辑的最大受益者——它不拥有最强的模型,却拥有最深的系统集成。这条路,中国公司、美国公司,所有企业服务玩家都在走。
新护城河:三项工程硬功夫
第一项:模型选型,别再追"最强"了
2025 年选模型这件事,已经变成一道多目标优化题。你面前摆着 Kimi K2.6、Qwen 3.6 27B、GLM 5.1,每家都有怪癖:有的长文本强但推理慢,有的代码好但中文一般,有的便宜但延迟高。以前大家迷信排行榜分数,现在排行榜和真实业务表现的相关性越来越弱——一个在 MMLU 上刷到 90 分的模型,可能在你的客服场景里连 70 分都打不出来。选模型的正确姿势是:先定义业务指标,再做小流量 A/B,最后用真实用户反馈校准。预算有限就押开源 + 微调,预算充足就混部闭源 + 开源做路由。记住,没有"最好"的模型,只有"最匹配你场景"的组合。
第二项:智能体循环——hill-climbing 是底牌
Agent 系统最反直觉的一点是:单步推理能力没那么重要,循环结构才重要。Tunguz 提到的 hill-climbing 循环——观察、决策、执行、反馈、再观察——听着像老掉牙的控制论,但在 LLM 时代它被重新激活了。原因是模型本身是"无状态"的,每次调用都是一次独立推理,没有记忆、没有积累;而真实的业务任务恰好相反——多轮、长程、需要纠错。能把一个简单循环搭得足够稳、足够快、足够便宜,就足以甩开 90% 的竞争对手。这里没有银弹,只有工程纪律:每一步的输入输出契约、失败重试策略、上下文压缩机制、成本熔断阈值——每一项都是硬功夫。
第三项:评估体系,比训练还难
整个 AI 行业最大的笑话是:我们花了几千亿美元训练模型,却拿不出几个靠谱的评估体系。传统软件有单元测试、有 E2E、有 SLO,AI 产品呢?大多数团队还在用"我自己跑几条数据感觉一下"。这是灾难性的。Agent 系统的评估必须双轨并行:一轨评模型本身在子任务上的表现,另一轨评整个循环在端到端任务上的成功率。更难的是,评估不能离线做完就扔——线上数据会漂移,用户行为会变,模型版本会迭代,评估体系必须跟着滚动起来。谁先把持续评估流水线跑通,谁就拿到了 Agent 时代的入场券。
黄金时代的入场姿势
小团队的反超机会
模型变便宜、智能体框架变成熟、评估工具变开源——这三个趋势叠加,对小团队来说反而是黄金窗口。大厂有数据壁垒、有客户渠道、有品牌,但在 Agent 这个新战场上,这些优势未必能直接迁移。一个 5 个人的创业团队,如果能在某个垂直场景里把循环设计做到极致、把单位 token 的智能密度压到最高,完全有机会从 Salesforce、Microsoft 嘴里抢下一块肉。Fin 团队在被收购前也就几十号人,做的事情看起来不复杂,但人家就是跑通了。
大厂的护城河焦虑
反过来看大厂,现在它们的焦虑是真实的。模型越来越像水电煤,差异化越来越难做;应用层又有无数小团队用开源武器打游击;客户也越来越精明,不再为"AI"两个字买单,要看实际 ROI。Salesforce 36 亿买 Fin,本质上是大厂用现金换时间、换团队、换工程能力的防御性动作。可以预见,接下来一年还会有更多类似收购——大厂在抢的不是市场份额,是工程人才和系统设计 know-how。
工程师的新功课
对于写代码的人来说,这轮变革的启示很直白:模型 API 调用能力已经不够看了,要补课的是 prompt 工程的工程化、Agent 框架的架构设计、评估流水线的搭建、数据闭环的运营——这些以前属于数据科学家和 ML 工程师的活,现在每个产品工程师都得会。准确讲,这是一次岗位定义的重新洗牌。三五年后简历上写"熟悉 LangChain 调参"和今天写"熟悉 jQuery"一样,已经不值钱了;值钱的是"我搭过一个日均百万次调用的 Agent 系统,持续跑了 18 个月没出过事故"。
回到开头那三件事。Anthropic 切断访问,是在告诉你别把鸡蛋放一个篮子里;Salesforce 36 亿收购 Fin,是在告诉你便宜模型 + 好工程 = 新护城河;Nadella 那番话,是在告诉你真正的竞争发生在系统层而不是模型层。三条线索汇成一句话:AI 应用的黄金时代已经来了,而门票不是更强的模型,是更硬的工程。这场游戏,谁先把选模型、搭循环、做评估这三项基本功练扎实,谁就能笑到最后。

