苹果终于对 Siri 动真格了。据 Ars Technica 报道,苹果正尝试把谷歌的 Gemini 超大模型 塞进 iPhone,为下一代 Siri 提供智力引擎。别指望来个微调版——这台万亿参数级别的巨兽,天生就不是为手机本地运行设计的。蒸馏,成了唯一能把它压进移动端的路径。但把万亿参数蒸馏到手机能跑的大小,可不是压缩一张照片,每一步都像在针尖上跳舞。
蒸馏本质上让一个“教师模型”教会一个小型“学生模型”模仿其输出,用更少参数复现智能。问题在于,从万亿参数蒸馏到可能仅剩数十亿参数的版本,还要保证推理质量不打骨折,同时扛住 iPhone 的散热和电池枷锁,这无异于地狱难度。几乎可以肯定,即使蒸馏成功,部分计算仍必须卸载到云端。苹果这些年把隐私和本地处理当牌坊,如今却可能被迫重新拥抱云端组件。讽刺的是,安卓阵营正拿端侧 AI 跑大模型当卖点,苹果本想借 Gemini 逆转,结果自己可能被云端绑住手脚。
竞争的吊诡就在这儿:如果苹果真把蒸馏版 Gemini 跑成了本地化,安卓手机标榜的端侧 Gemini Nano 优势顷刻归零——毕竟那只是个轻量级小模型。但万一蒸馏失败,或者依旧依赖云端,Siri 照旧迟钝,这步棋就成了拖累。库克说过,Siri 是苹果 AI 的入口,现在这个入口通向谷歌多少有点意味深长。不管怎样,这场跨阵营的模型嫁接,已经把移动端 AI 的博弈推入了深水区。

