当前所在位置:首页 >> 知识

【宿舍完整录音曝光未删减】何恺明 MIT 最新演讲：未来工作将聚焦 AI for science

发布时间：2025-09-13 17:25:34 作者：iyi 点击：12 【字体：大中小】

作者 | 黄楠

编辑 | 陈彩娴

又一名 AI 大神有了新动向！何恺

当地时间3月13日下午3点，最新作何恺明在MIT做学术演讲。演讲据现场网友所述，未工即便自己提前半小时去到现场，聚焦但仍挤不进会场，何恺宿舍完整录音曝光未删减仅排队就拐了几个弯，最新作MIT CSAIL 还临时开了隔壁会议室投屏，演讲许多人是未工挤在小角落里听完全程的。

据 MIT CSAIL 实验室此前发布公告显示，聚焦本次何恺明的何恺演讲主题是 "In Pursuit of Visual Intelligence"（追求视觉智能）。

在现场演讲中，最新作何恺明按时间线顺序回顾其之前的演讲几篇工作，主要包括了 ResNet、未工Faster R-CNN、聚焦Mask R-CNN、MoCo 和 MAE。张某明星塌房合集据何恺明所言，“在 ResNet 出现以前，Deep learning 的大厦上空漂浮着一朵乌云，而 ResNet 去掉了这朵乌云。”

此外，何恺明也在现场透露了接下来的研究方向会是 AI for science，将聚焦视觉和 NLP 大一统做 self-supervised X+AI。

何恺明 MIT 最新演讲：未来工作将聚焦 AI for science

会议室爆满（图源：知乎）

MIT CSAIL 隔壁会议室满座（图源：知乎@睡不醒的芋泥）

（图源：知乎@睡不醒的芋泥）

何恺明将回归学术界？

何恺明是 CV 领域的翘楚，其谷歌学术被引用次数已经突破40万次，在2022年人工智能全球最具影响力学者榜单中，何恺明获得第一名。

何恺明 MIT 最新演讲：未来工作将聚焦 AI for science

自3月9日何恺明将在 MIT 进行 Job talks（求职演讲）的消息传出后，很快引起 AI 圈的关注。Job talks 是学术界的一个传统，多集中在每年的三四月份进行，申请博士或教职的学者会到高校内做学术报告，演讲内容多为自己的研究成果。

随后杜克大学教授陈怡然也在微博上发声，表示“一直听说何恺明在Market上，靴子终于落了地。”

值得一提的是，如果何恺明确认加入 MIT，那他将会成为全校被引用次数最高的学者。目前 MIT 全校被引用量最高的是化学与生物医学工程系的 Robert Langer，总引用量超过38万次。

何恺明 MIT 最新演讲：未来工作将聚焦 AI for science

有网友表示，何恺明能够进入到 MIT 的 Job talks 阶段，说明他已通过简历筛选，其研究成果和能力上得到 MIT 的认可，但这并不意味着何恺明最终会选择加入 MIT。

从高考状元到 CV 大神

何恺明是广东人，从小在广州长大，在广州执信中学读书时曾获得全国物理竞赛和省化学竞赛的一等奖。2003年5月，何恺明获得保送清华的资格，同年他以满分900分的成绩，成为当年广东省9位满分状元之一。进入清华大学以后，何恺明放弃保送的机械工程及其自动化专业转向基础科学班。

2007年，还未毕业的何恺明进入微软亚洲研究院实习，出于对计算机图形图像课程的兴趣，他选择加入了视觉计算组。头两年里，何恺明尝试做过不少各种各样的课题，但一直发不了论文，这对此前头顶着高考满分状元光环的他来说，无疑是个不小的打击。

何恺明花了更多时间在问题研究上，甚至在电脑游戏里找灵感。不鸣则已，一鸣惊人。2009 年，汤晓鸥、何恺明以及孙剑凭借论文“Single Image Haze Removal Using Dark Channel Prior ”，获得该年度 CVPR 的最佳论文奖，这也是该会议 30 年以来第一次（也是唯一一次）颁发给亚洲研究学者。

何恺明 MIT 最新演讲：未来工作将聚焦 AI for science 汤晓鸥（左）和何恺明（右）

2011年，何恺明从香港中文大学多媒体实验室（MMLab）博士毕业，后加入微软亚洲研究院工作；2016年8月，他离开微软亚洲研究院，转而加入 Facebook AI 研究院（FAIR）。

2015年，由何恺明提出的深度残差网络 ResNet ，在 ILSVRC 2015 分类任务竞赛中，首次超越人类水平，斩获竞赛第一名，该工作还拿到了 2016 年 CVPR 最佳论文。

ResNets 也成为计算机视觉领域的流行架构，并被用于机器翻译、语音合成、语音识别和 AlphaGo 的研发上。目前，何恺明谷歌学术被引用量已经超过40万次，其中引用量最高的，也是这篇工作，单篇引用量在2021年底突破10万次，目前已涨至15万次。

在 FAIR 期间，何恺明和团队在计算机视觉领域取得了不少亮眼的成绩，包括 Faster R-CNN、Mask R-CNN 等系列研究。其中，Mask R-CNN 解决了图片中的实例级对象分割问题，不仅能将照片中的人、动物等对象单一检测，还可为其每个对象实例生成一个高质量分隔遮罩，该工作获得了 ICCV 2017 的最佳论文奖。

而在去年火热的 AIGC 领域，何恺明团队在原有的 CLIP 架构基础上，使用掩码方法，不仅实现新模型速度3.7倍的提升，模型性能也得到了一定程度的优化。