苹果在今天的WWDC 2026特别前瞻会上宣布,即将推送的iOS 20系统将首次集成参数量高达300亿的Apple Intelligence Pro大模型,并完全在iPhone 17 Pro系列的本地NPU上流畅运行,无需任何网络连接。该端侧模型在常识推理、多语言实时翻译及设备深度控制上的表现,已在测试中匹敌2024年初云端版本的GPT-4。
要在手机受限的内存(通常为8GB-12GB)和功耗预算内跑通300亿参数模型,是一项极具挑战的系统工程。苹果的破局之道在于软硬协同的“极致压缩”。硬件上,A19 Pro芯片采用了全新的混合精度计算架构与超宽带内存控制器;软件上,苹果应用了具有专利的动态量化技术(将非核心权重压缩至2-bit)与推测性解码算法。这使得iPhone在不牺牲续航的前提下,拥有了极高的本地Token生成速度。

