一年前,Anthropic 搞了一场有点"较劲"意味的实验 Project Fetch:让一组人类带着 Claude Opus 4.1 去操控四足机器人,再让另一组人纯靠双手干同样的活。结果 AI 辅助组大胜——能聊、能写代码的大模型,套上机器人身上确实管用。但 Anthropic 显然不满足于此,于是有了第二阶段:把人类彻底踢出操作链,让 Claude Opus 4.7 自己上。结果让人有点恍惚——模型独立完成了全部任务,速度比当初最快的人类团队快了约 20 倍,比完全没 AI 加持的对照组快了 37 倍以上。更夸张的是代码量:少了将近十倍。
在传感器连接、路径规划这类偏"软件思维"的环节,Opus 4.7 表现堪称丝滑。毕竟对大模型来说,解析接口文档、规划执行序列本就是看家本领。但实验也诚实地暴露了短板:像把沙滩球精准推到某个点这种需要实时反馈、毫米级微调的闭环控制任务,模型依然磕磕绊绊。语言能描述"把球推过去",但物理世界里的摩擦力、地面倾斜、机械延迟,这些东西还没被完全内化进参数里。
有意思的是,这次飞跃并不是靠什么机器人专项训练换来的。没有专门的数据集、没有强化学习微调、没有模仿学习的千万条轨迹——纯粹是把通用模型做得更强,然后让它直接"上手"物理硬件。这条路径一旦走通,意味着具身智能的门槛可能比我们想象的要低得多:不需要从零造一套机器人专属大模型,而是让"会思考的那个"顺便"会动手"。Agent 赛道、机器人创业公司、甚至工业自动化方案商,都该重新算一遍账了。

