当前位置：首页 > news >正文

71万次引用、ResNet之父、MIT终身教授：何恺明的AI封神之路

news 2026/4/7 11:21:37

何恺明：从高考状元到AI传奇，他的ResNet改写了人工智能史

“这显示了全球范围内都存在着杰出的科学家，并且创新的灵感可以源自世界的任何一个角落。”——杨立昆（Yann LeCun），深度学习三巨头之一，如此评价何恺明和ResNet的成就。

前言

在人工智能的编年史上，有些名字注定被铭记。

何恺明，就是这样一个名字。

2025年，Nature杂志公布21世纪以来引用次数最多的25篇论文，排名第一的不是诺贝尔奖得主的科学发现，不是基因编辑的革命性突破，而是一篇关于图像识别的AI论文——《Deep Residual Learning for Image Recognition》。

这篇论文的第一作者，正是何恺明。

截至2025年，何恺明的Google Scholar总引用量已超过71万次，其中ResNet单篇论文被引超过28万次，是计算机视觉乃至整个深度学习领域被引用次数最多的论文。

从2009年成为CVPR最佳论文首位华人得主，到2016年ResNet横扫ImageNet竞赛，再到2023年获得未来科学大奖、2025年当选美国国家人工智能科学院院士——何恺明用20年时间，完成了从清华物理系本科生到MIT终身教授、谷歌DeepMind杰出科学家的华丽转身。

本文将从何恺明的学术起点出发，深度解析这位AI传奇的成长轨迹、核心贡献与深远影响。

第一章：少年天才——从高考状元到清华物理系

1984年，何恺明出生于广东广州。

从小在广州长大的他，在广州市执信中学就读期间就展现出过人的天赋——获得全国物理竞赛一等奖、广东省化学竞赛一等奖。

2003年5月，凭借全国物理竞赛一等奖，何恺明被保送至清华大学机械工程及自动化专业。但这位少年并没有安于现状——他选择继续参加高考，最终以标准分900分的成绩成为当年广东省9位满分状元之一。

进入清华大学后，何恺明做出了一个改变人生轨迹的决定：放弃原本保送的专业，转而选择基础科学班。这个被誉为清华“最牛班级”的试验班，旨在培养基础科学领域的拔尖人才。

在清华的四年里，何恺明连续三年获得清华奖学金，打下了扎实的数学和物理基础。这些看似与计算机视觉无关的训练，却为他日后提出ResNet的核心思想埋下了伏笔——物理学的直觉和数学的严谨，让他能够穿透表象，抓住问题的本质。

2007年，何恺明从清华物理系毕业。同年，他进入香港中文大学攻读研究生，师从汤晓鸥——这位后来被称为“将香港中文大学建成中国计算机视觉界黄埔军校”的学者。

第二章：一战成名——首位华人CVPR最佳论文得主

2009年，计算机视觉顶级会议CVPR在美国迈阿密举行。

一篇题为《Single Image Haze Removal Using Dark Channel Prior》（基于暗原色的单一图像去雾技术）的论文，获得了当年的CVPR最佳论文奖。

这是CVPR自创办25年以来，首次有华人乃至亚洲学者获得这一殊荣。论文的第一作者，正是当时还是博士研究生的何恺明。

这篇论文提出了一种基于“暗通道先验”的图像去雾算法，能够从单张图像中有效去除雾霾的影响，恢复出清晰的图像。这个想法简单而深刻——何恺明发现，在大多数无雾图像中，至少有一个颜色通道在某些像素点上的值非常低。利用这一统计规律，就可以估算出雾的浓度并进行有效去除。

这篇论文展现了何恺明研究风格的最初雏形：用最简单的方法解决最本质的问题。这种“简单和本质”的原则，后来贯穿了他整个学术生涯。

第三章：ResNet诞生——改写了深度学习的历史

2015年，何恺明在微软亚洲研究院工作期间，带领团队提出了深度残差网络（ResNet）。

当时，深度学习领域面临一个棘手的问题：随着网络层数的增加，模型的性能不仅没有提升，反而会下降。这就是著名的网络退化问题。许多人认为，这是因为网络越深越难训练，梯度消失问题无法解决。

但何恺明和他的团队给出了一个出人意料的答案：不是网络太深没法训练，而是网络太深“学不动”了。

他们的解决方案异常简洁：在网络的每一层引入一个“直连通道”，让输入可以直接“跳跃”到输出。这样一来，网络需要学习的就不再是完整的映射，而是输入与输出之间的“残差”。

这个想法看似简单，却蕴含着深刻的洞察：与其让网络学习一个复杂的完整映射，不如让它学习一个简单的“差值”。

2015年底，ResNet论文作为预印本发布。2016年，论文正式发表，并再次获得CVPR最佳论文奖。

ResNet的表现惊艳了整个AI界：

在ImageNet图像识别大赛中，ResNet-152以152层的深度击败了谷歌、英特尔、高通等业界团队，斩获第一名；
ResNet解决了深度网络的梯度传递问题，使得研究人员可以训练超过150层的神经网络，比此前常用的网络层数多5倍以上；
在ResNet之前，“深度学习”并没有那么“深”。

何恺明自己曾这样总结：“在ResNet之前，深度学习并没有那么‘深’。”

第四章：ResNet的深远影响——重新定义深度学习的边界

ResNet的影响力，早已超越了计算机视觉的范畴。

🧬 AlphaGo & AlphaFold

DeepMind的AlphaGo Zero和AlphaFold都使用了ResNet作为核心网络架构。残差连接让这些模型能够达到前所未有的深度和性能。

🤖 ChatGPT & GPT系列

今天的大语言模型，无论是GPT系列还是BERT，都普遍采用了残差结构来支撑上百层Transformer的堆叠。可以说，没有ResNet，就没有今天的大模型时代。

📊 数据说话

截至2025年，ResNet论文在Google Scholar上的引用量已超过28万次。Nature杂志的统计分析显示，这是21世纪被引用次数最多的论文。

🌍 全球认可

2023年，何恺明与张祥雨、任少卿、孙剑共同获得未来科学大奖数学与计算机科学奖，共享100万美元奖金。这是未来科学大奖首次将数学与计算机科学奖颁给四位获奖人，何恺明也成为该奖历史上最年轻的获奖者之一。

2025年，何恺明当选美国国家人工智能科学院院士。

同年，他十年前发表的另一篇论文《Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification》被授予Helmholtz Prize——这是一个被视为“十年影响力奖”的荣誉，只颁给十年前的ICCV论文中被时间验证对计算机视觉领域产生“基础性、深远影响”的工作。

第五章：杨立昆的高度评价——“灵感可以源自世界的任何一个角落”

对于何恺明和ResNet的成就，深度学习三巨头之一的**杨立昆（Yann LeCun）**曾给予高度评价。

杨立昆在采访中表示：

“这显示了全球范围内都存在着杰出的科学家，并且创新的灵感可以源自世界的任何一个角落。”

这句话分量极重。作为卷积神经网络（CNN）的奠基人之一，杨立昆深知ResNet对于整个深度学习领域的意义。他的评价不仅是对何恺明个人能力的认可，更是对全球AI研究格局的深刻洞察——顶尖的创新，不再只属于硅谷。

另一位AI教父**杰弗里·辛顿（Geoff Hinton）**也曾在不同场合表达对何恺明工作的赞赏。辛顿指出，AI领域的论文在引用方面具有天然优势，但ResNet的引用量能够达到如此高度，证明了其在AI发展中的基石地位。

第六章：持续创新——从Mask R-CNN到MAE

ResNet之后，何恺明并没有停下脚步。

在Facebook AI Research（FAIR）工作期间，他带领团队又推出了一系列开创性工作：

🎭 Mask R-CNN（2017）

Mask R-CNN解决了图片中的实例级对象分割问题——不仅能检测出照片中的人、动物等对象，还能为每个对象实例生成高质量的分割遮罩。这项研究获得了ICCV 2017最佳论文奖（马尔奖）。

🔍 SimCLR（2020）

SimCLR是一种简单有效的对比学习框架，大幅提升了无监督学习的性能，让模型不需要大量标注数据就能学到有用的特征表示。

🎨 MAE（2021）

2021年11月，何恺明以一作身份发表论文《Masked Autoencoders Are Scalable Vision Learners》，提出了一种泛化性能良好的计算机视觉识别模型。MAE将“掩码”思想引入视觉领域，与同期的大语言模型预训练思路不谋而合，刚刚发表就成为计算机视觉圈的热门话题。

第七章：学术回归与新的征程

2023年，何恺明做出一个重要决定：从产业界回归学术界。

他于2024年2月加入麻省理工学院（MIT）电子工程与计算机科学系，担任副教授。一年后，也就是2025年6月，他获得MIT终身教职。

这标志着何恺明完成了从“产业界明星”到“学术殿堂学者”的身份转变。在MIT，他开设的课程广受学生欢迎，继续培养下一代AI人才。

2025年6月，何恺明的最新动向再次引发关注：他以“兼职杰出科学家”的身份加入谷歌DeepMind。

事实上，何恺明与谷歌的合作早有伏笔。2025年2月，他与谷歌DeepMind全华人班底合作发表了论文《Fractal Generative Models（分形生成模型）》，首次使逐像素生成高分辨率图像成为可能。此前，他与谷歌团队还合作提出了基于连续标记的随机顺序自回归模型Fluid，为自回归文生图模型的扩展指出了新方向。

从微软亚洲研究院到Facebook AI Research，从MIT到谷歌DeepMind——何恺明的每一次转身，都牵引着整个AI界的目光。

您说得完全正确，这是一个重要的事实错误。我已经将第八章“科研哲学——‘简单和本质’”中的相关表述修正如下：