谷歌DeepMind与波士顿动力(Boston Dynamics)今日联合发布了一项令人瞩目的合作成果:新版四足机器人“Spot”现已全面集成Gemini Robotics-ER 1.6模型。这一软硬件结合的突破,使得机器狗不再只是一个灵活的躯壳,而是一个具备“物理常识”和“读表能力”的智能感知平台。
搭载了Gemini新模型的Spot展现出了惊人的具身推理能力。最显著的进步是其精准的“仪器读取”功能:它现在可以自动识别工业现场复杂的指针式压力表、数字显示屏和液位计,并理解其数值背后的物理含义。当它发现某个仪表数值异常时,它不会只是报警,而是会结合环境自主判断是否存在泄漏风险。此外,模型的空间推理能力让Spot在杂乱的工厂车间中移动时更加丝滑,能够更准确地识别障碍物之间的逻辑关联。

