科技前沿今日传来振奋人心的消息,以英伟达(NVIDIA)和硅谷明星初创Physical Intelligence为代表的“物理人工智能(Physical AI)”技术迎来突破性进展。全新一代视觉-语言-动作(VLA)大模型正式步入成熟期,赋予了人形机器人前所未有的自然语言理解和现实世界问题解决能力。
行业最新测评显示,英伟达的GR00T N1.6(拥有22亿参数)和pi-0.5(拥有30亿参数)等多款原生VLA模型已成为全球具身智能的标准组件。与传统需要一行行编写代码的机器人不同,搭载这些大模型的机器人只需听取人类的一句自然语言指令(例如“把桌子上那个红色的杯子递给我,注意避开旁边的水渍”),便能瞬间整合高清摄像头视野、雷达传感器数据,并自动转化为流畅、安全的物理机械动作。
过去几十年的机器人技术一直局限于在结构化、封闭环境(如汽车装配线)中执行重复性动作。但真实的人类社会充满了不可预测性和动态变化。随着生成式AI的底层突破,模型不仅能够“思考”文本,现在还能够“理解”三维空间和物理定律,这被称为AI的“世界模型”觉醒。

