阶跃首席科学家张祥雨合著论文 ResNet 获 CVPR 2026 「时间检验奖」

发布时间： 2026-06-07 文章分类： AI前沿技术

阅读量： 0

企业级AI智能体开发与部署

LumeValley提供全栈式企业级AI智能体开发与部署服务，涵盖战略规划、场景化开发、企业级应用构建、行业解决方案及算力支撑。从需求分析到持续优化，确保智能体高效稳定运行，助力企业实现智能化转型，提升运营效率与竞争力。

2024年CVPR的年度奖项，颁给了一篇10年前的论文。ResNet，一个在当时看来略显“取巧”的架构设计，拿下了计算机视觉领域最高会议的“时间检验奖”。这不是一份迟到的荣誉，而是一枚盖棺论定的印章：它想证明，有些创新的价值，需要拉长时间维度才能看清。

迟到十年的奖项，盖章了什么？

从19层到152层：一场静悄悄的军备竞赛

在ResNet出现前，深度神经网络的训练是一场令人沮丧的尝试。人们普遍认为，只要把网络堆得足够深，模型的性能就应该越好。但现实给了沉重一击：网络一旦超过某个临界深度（大约20层），性能不升反降，出现了所谓的“退化”现象。这并非过拟合，而是网络自身训练出了问题。

梯度消失与“耳语游戏”

根本原因在于“梯度消失”。在反向传播过程中，梯度信号需要经过层层网络向回传递。就像一场“耳语游戏”，每经过一层，信号就衰减一分。当网络极深时，传到最初几层的梯度信号已经微弱到无法驱动参数有效更新，整个网络的学习就此停滞。VGGNet将网络推至19层已属极限，更深的梦想似乎被技术瓶颈封死。

残差连接：一个改变格局的“小把戏”

“抄近道”的高速公路

何恺明、张祥雨、任少卿和孙剑的论文提出了一个极其简洁的想法：既然直接学习一个复杂的映射H(x)很难，那我让网络去学习这个映射相对于输入x的残差F(x) = H(x) - x。在网络中，这意味着增加一条“捷径连接”，将输入x直接绕过几层卷积层，与后面的输出相加。网络需要学习的目标，从一个全新的函数H(x)，变成了对输入的微小修正F(x)。这好比在盘山公路（原始层）旁，修建了一条直达山顶的高速公路（捷径），让信息和梯度可以一路畅行。

退化问题消失了

这个设计一举击破了退化难题。理论上，如果恒等映射是最优解，那么将残差F(x)驱动到0比从头学习一个恒等映射要容易得多。实验中，一个152层的残差网络在ImageNet上的表现全面碾压了更浅的网络，且训练过程平滑稳定。深度学习的“深度”瓶颈被正式打开，一场从几十层到上千层的网络军备竞赛由此拉开序幕。

ResNet之后：AI产业的真实推进器

从ImageNet榜单到你手机里的人脸解锁

ResNet的影响力绝不限于学术论文的引用数。它直接奠定了后续数年计算机视觉产业化的技术基石。在它之后，各种“网络加宽”（如Inception）与“网络加深”的研究层出不穷，但残差连接的基本思想成为所有复杂网络设计的标准组件。你每天使用的人脸识别、手机相册的智能分类、自动驾驶的视觉感知系统，其核心模型的“骨架”中，都流淌着残差连接的血液。它将计算机视觉从一个研究课题，变成了一个可靠、可部署的工程问题。

一次成功的工程范式转移

更深层的影响在于，ResNet展示了一种高效的AI研发范式：通过极简而优雅的架构设计，解决核心的训练瓶颈，从而释放出强大的模型能力。它不像暴力堆叠算力或数据那样粗暴，而是从数学和原理层面“疏通管道”。这种思路直接影响了后续BERT、GPT等语言模型的架构设计——Transformer中无处不在的残差连接和层归一化，便是这一思想的跨领域传承。

在AGI喧嚣中，重温ResNet的启示

当大家谈论智能时，ResNet在解决“学习”本身

当下，整个AI行业沉浸在GPT-5、具身智能、世界模型的宏大叙事中。参数规模成为头条，涌现能力被反复讨论。然而，ResNet的故事像一剂清醒剂。它提醒我们，在追逐最前沿应用时，底层训练方法论中一个看似微小的梗阻，就足以锁死整个领域前进的道路。ResNet没有创造新的智能形式，它只是让深度神经网络真正拥有了“深度学习”深度的能力。

简洁、优雅、致命

十年后重读这篇论文，其魅力不在于复杂的数学推导或庞杂的实验，而在于其思想的极度简洁与洞察的精准。它没有增加模型的复杂度，反而通过一个加法操作解决了根本问题。这种“四两拨千斤”的创新，在当下堆算力、拼数据的洪流中显得尤为珍贵。真正的突破，有时不在于你往系统中添加了什么新东西，而在于你精妙地疏通了系统内生的堵点。

结语：奖项之外的价值标尺

CVPR的时间检验奖，授予的是经得起时间考验的贡献。ResNet的贡献，是它重新定义了“深度”的可能性，为随后十年的视觉智能乃至通用深度学习模型铺设了基石。阶跃星辰的公告只是一纸喜报，但喜报背后的事实值得所有从业者驻足回望：技术进步的里程碑，往往不是某个惊世骇俗的天才构想，而是一个针对核心痛点、设计极致简洁、且能被整个生态广泛接纳并传承的解决方案。在这一点上，ResNet是永恒的范本。

企业级AI智能体开发与部署方案

LumeValley打造企业级AI智能体全流程方案，涵盖需求洞察、定制开发、多平台适配部署。凭借专业算法与丰富经验，确保智能体精准理解业务，高效执行任务，无缝融入企业生态，为企业数字化转型提供强劲智能引擎，提升核心竞争力。

点赞 | 20

Lumevalley——全栈AI服务领航者，以“战略-应用-算力”三位一体服务框架，为企业提供从顶层战略规划、场景化AI智能体（AI Agent）开发/搭建/部署，到企业级AI应用开发、AI+行业场景解决方案的全链路服务，并配套AI大模型部署与高性能AI算力底座支撑，助力客户在营销、服务、运营等核心环节实现效率倍增与模式创新。