在即将在2026年举办的人工智能顶级会议ICLR上,中国企业的原创技术再次大放异彩。中国联通研究院团队提出了一种名为MeanCache的创新型扩散模型缓存框架,成功刷新了多模态生成模型的推理加速基准。当前的图像及视频生成大模型在推理过程中需要耗费大量算力进行逐步去噪,导致生成耗时较长。
MeanCache框架则巧妙地利用了扩散过程中特征图的均值特性,通过智能识别并缓存冗余的计算步骤,大幅减少了不必要的重复算力消耗。实验数据表明,该框架在保证生成图像和视频质量几乎无损的前提下,将整体推理速度提升了数倍之多。这一成果彰显了底层核心算法领域的深厚积累,为未来流媒体生成以及虚拟环境构建提供了极具价值的低延迟解决方案。

