机器人终于开始自己"加班"了。NVIDIA GEAR实验室刚刚把ENPIRE系统摆上桌,这是业内头一次让多智能体在物理世界里完成真正意义上的自主研究——不是仿真环境里跑分,不是远程操控录demo,而是8个Codex智能体各自掌管一台实体机器人,带着GPU算力和token预算,自己决定下一步干什么。整套系统可以通宵无人值守运行,这事本身就够疯狂。
安全是这种系统最容易翻车的地方,ENPIRE的处理思路很直接:硬件兜底。硬运动极限切断加上扭矩受限夹爪,两层物理保险把"机器人发疯"的概率压到最低,比靠软件prompt劝它别乱来靠谱得多。奖励函数则通过视觉分类器离线固定并冻结,从根本上堵死了智能体钻空子作弊的可能——它没办法通过篡改reward信号来骗系统说"我成功了"。配合实时监测的机器人利用率(MRU)、token利用率(MTU)和GPU利用率三套指标,团队用Tokens-to-Success和Time-to-Success两个维度来衡量效率,把"花了多少脑子和算力才搞定一个任务"这件事量化得很干净。
实际跑起来的结果也硬核:ENPIRE自主完成了扎带紧固、细针归整、GPU安装这些吃精度又吃决策的任务,而且8台机器人并行探索的速度显著快于更小的团队——这是物理世界里实打实验证的扩展效应。Jim Fan团队的野心很清楚:把具身智能从"人类监督下的演示"推向"脱离人类探索未知",这个转变的意义怎么估都不为过。更关键的是系统即将开源,这意味着任何有机器人和GPU的实验室都能复现这套范式,具身智能的AGI锚点,第一次有了可被广泛验证的物理底座。

