搜索
当前所在位置:首页 >> 知识

【宿舍完整录音曝光未删减】何恺明 MIT 最新演讲:未来工作将聚焦 AI for science

发布时间:2025-09-13 17:25:34 作者:iyi 点击:12 【 字体:


作者 | 黄楠

编辑 | 陈彩娴

又一名 AI 大神有了新动向!何恺

当地时间3月13日下午3点,最新作何恺明在MIT做学术演讲。演讲据现场网友所述,未工即便自己提前半小时去到现场,聚焦但仍挤不进会场,何恺宿舍完整录音曝光未删减仅排队就拐了几个弯,最新作MIT CSAIL 还临时开了隔壁会议室投屏,演讲许多人是未工挤在小角落里听完全程的。

据 MIT CSAIL 实验室此前发布公告显示,聚焦本次何恺明的何恺演讲主题是 "In Pursuit of Visual Intelligence"(追求视觉智能)。

在现场演讲中,最新作何恺明按时间线顺序回顾其之前的演讲几篇工作,主要包括了 ResNet、未工Faster R-CNN、聚焦Mask R-CNN、MoCo 和 MAE。张某明星塌房合集据何恺明所言,“在 ResNet 出现以前,Deep learning 的大厦上空漂浮着一朵乌云,而 ResNet 去掉了这朵乌云。”
此外,何恺明也在现场透露了接下来的研究方向会是 AI for science,将聚焦视觉和 NLP 大一统做 self-supervised X+AI。

何恺明 MIT 最新演讲:未来工作将聚焦 AI for science

会议室爆满(图源:知乎)

何恺明 MIT 最新演讲:未来工作将聚焦 AI for science

MIT CSAIL 隔壁会议室满座(图源:知乎@睡不醒的芋泥)

何恺明 MIT 最新演讲:未来工作将聚焦 AI for science(图源:知乎@睡不醒的芋泥)


1

何恺明将回归学术界?

何恺明是 CV 领域的翘楚,其谷歌学术被引用次数已经突破40万次,在2022年人工智能全球最具影响力学者榜单中,何恺明获得第一名。

何恺明 MIT 最新演讲:未来工作将聚焦 AI for science

自3月9日何恺明将在 MIT 进行 Job talks(求职演讲)的消息传出后,很快引起 AI 圈的关注。Job talks 是学术界的一个传统,多集中在每年的三四月份进行,申请博士或教职的学者会到高校内做学术报告,演讲内容多为自己的研究成果。

随后杜克大学教授陈怡然也在微博上发声,表示“一直听说何恺明在Market上,靴子终于落了地。”

何恺明 MIT 最新演讲:未来工作将聚焦 AI for science

值得一提的是,如果何恺明确认加入 MIT,那他将会成为全校被引用次数最高的学者。目前 MIT 全校被引用量最高的是化学与生物医学工程系的 Robert Langer,总引用量超过38万次。

何恺明 MIT 最新演讲:未来工作将聚焦 AI for science

有网友表示,何恺明能够进入到 MIT 的 Job talks 阶段,说明他已通过简历筛选,其研究成果和能力上得到 MIT 的认可,但这并不意味着何恺明最终会选择加入 MIT。

2

从高考状元到 CV 大神

何恺明是广东人,从小在广州长大,在广州执信中学读书时曾获得全国物理竞赛和省化学竞赛的一等奖。2003年5月,何恺明获得保送清华的资格,同年他以满分900分的成绩,成为当年广东省9位满分状元之一。进入清华大学以后,何恺明放弃保送的机械工程及其自动化专业转向基础科学班。

2007年,还未毕业的何恺明进入微软亚洲研究院实习,出于对计算机图形图像课程的兴趣,他选择加入了视觉计算组。头两年里,何恺明尝试做过不少各种各样的课题,但一直发不了论文,这对此前头顶着高考满分状元光环的他来说,无疑是个不小的打击。

何恺明花了更多时间在问题研究上,甚至在电脑游戏里找灵感。不鸣则已,一鸣惊人。2009 年,汤晓鸥、何恺明以及孙剑凭借论文“Single Image Haze Removal Using Dark Channel Prior ”,获得该年度 CVPR 的最佳论文奖,这也是该会议 30 年以来第一次(也是唯一一次)颁发给亚洲研究学者。

何恺明 MIT 最新演讲:未来工作将聚焦 AI for science汤晓鸥(左)和何恺明(右)

2011年,何恺明从香港中文大学多媒体实验室(MMLab)博士毕业,后加入微软亚洲研究院工作;2016年8月,他离开微软亚洲研究院,转而加入 Facebook AI 研究院(FAIR)。

2015年,由何恺明提出的深度残差网络 ResNet ,在 ILSVRC 2015 分类任务竞赛中,首次超越人类水平,斩获竞赛第一名,该工作还拿到了 2016 年 CVPR 最佳论文。

ResNets 也成为计算机视觉领域的流行架构,并被用于机器翻译、语音合成、语音识别和 AlphaGo 的研发上。目前,何恺明谷歌学术被引用量已经超过40万次,其中引用量最高的,也是这篇工作,单篇引用量在2021年底突破10万次,目前已涨至15万次。

在 FAIR 期间,何恺明和团队在计算机视觉领域取得了不少亮眼的成绩,包括 Faster R-CNN、Mask R-CNN 等系列研究。其中,Mask R-CNN 解决了图片中的实例级对象分割问题,不仅能将照片中的人、动物等对象单一检测,还可为其每个对象实例生成一个高质量分隔遮罩,该工作获得了 ICCV 2017 的最佳论文奖。

而在去年火热的 AIGC 领域,何恺明团队在原有的 CLIP 架构基础上,使用掩码方法,不仅实现新模型速度3.7倍的提升,模型性能也得到了一定程度的优化。


3

离开大厂的 AI 大牛再添一员

事实上,早在去年 Meta 第一波裁员时,就有消息传出何恺明也在被裁名单中,但彼时阿里巴巴副总裁贾扬清在相关知乎问题下对这一消息进行了否认。

何恺明 MIT 最新演讲:未来工作将聚焦 AI for science

何恺明所在的 Facebook AI Research 自去年以来,已经发生过几次重大调整。

其中,图灵奖得主杨立昆(Yann LeCun)负责基础研究,Jerome Pesenti 负责管理整理 AI 部门的技术、产品赋能、运营等工作。但自2022年6月开始,FAIR 被并入至元宇宙部门Reality Labs,杨立昆转向该部门的首席科学家 Andrew Bosworth 汇报。

后续的调整也是围绕“去中心化组织结构”进行,重点在削减对基础研究的投入。

可以看到,即便如 Facebook 这样的巨头在整体预算整体收缩之际,AI 研究院率先面临了被边缘化的困局。

预算缩减、人心涣散,直接导致了优秀人才的离职频发。这些离开的 AI 大牛有两条发展路径:一是从工业界回到学术界,二是从大厂离开、自己创业,担任CEO或CTO等要职,并持续从风险投资人处成功获得融资。

就在半月前,亚马逊机器学习部门原杰出科学家/VP Alex Smola 与首席科学家李沐师徒二人离职,进军大模型方向创业,此次何恺明前往 MIT 面试教职的消息,也再次引发外界对大厂 AI 实验室和 AI 人员的讨论和思考。

参考链接:
1.https://www.csail.mit.edu/event/eecs-special-seminar-kaiming-he-pursuit-visual-intelligence

2.https://www.zhihu.com/question/588205714

更多内容,点击下方关注:

何恺明 MIT 最新演讲:未来工作将聚焦 AI for science

何恺明 MIT 最新演讲:未来工作将聚焦 AI for science

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!

公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

雷峰网(公众号:雷峰网)

雷峰网版权文章,未经授权禁止转载。详情见转载须知。

何恺明 MIT 最新演讲:未来工作将聚焦 AI for science

阅读全文
相关推荐

视觉模型智能涌现后, Scaling Law 不会到头

视觉模型智能涌现后, Scaling Law 不会到头
Scaling Law 或将终结——这是最近备受热议的话题之一。该讨论最初源自于哈佛大学一篇名为《Scaling Laws for Precision》的论文,其研究表明当下的语言模型在大量数据上经历 ...

反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了
2 月 16 号,马斯克在 X 上发布了一条自家 Grok 3 模型的发布预告。并配文“地球上最聪明的 AI”要来了。北京时间 2025 年 2 月 18 日中午,马斯克如约带领着 xAI 的工程师和 ...

万字实录:VLA 范式,具身智能的曙光与迷雾丨GAIR Live

万字实录:VLA 范式,具身智能的曙光与迷雾丨GAIR Live
整理丨赖文昕编辑丨陈彩娴VLA视觉-语言-动作模型)作为具身智能领域的关键新范式,能有效整合视觉信息、语言指令与行动决策,显著提升机器人对复杂环境的理解和适应能力,对推动机器人从单一任务执行向多样化场 ...

“通用大脑”来了!MIT何恺明用大模型思维玩出机器人预训练新花样

“通用大脑”来了!MIT何恺明用大模型思维玩出机器人预训练新花样
在机器人领域,一场关于“通用智能”的探索正如火如荼地展开。MIT 的何恺明和 Lirui Wang 等人最近成功在“通用数据”上取得了进展,让机器人离拥有“通用大脑”的目标又近了一步。机器人数据的异质 ...

独家丨字节招兵买马,拟在欧洲设立AI研发中心

独家丨字节招兵买马,拟在欧洲设立AI研发中心
雷峰网(公众号:雷峰网)独家获悉,字节跳动准备在欧洲设立 AI 研发中心。知情人士透露,字节跳动目前已经开始寻找欧洲的 LLM 和 AI 方面技术大牛,积极招揽人才。而纵观欧洲各国的 AI 技术水平, ...

阿德莱德大学吴琦:VLN 仍是 VLA 的未竟之战丨具身先锋十人谈

阿德莱德大学吴琦:VLN 仍是 VLA 的未竟之战丨具身先锋十人谈
作者 | 赖文昕编辑 | 陈彩娴2018 年 6 月,在澳大利亚机器人视觉研究中心ACRV)做博士后研究员的吴琦和博士生 Peter Anderson 首次将 VL视觉-语言)和彼时机器人领域主流的导 ...

国产 AI Infra 变革进行时:新势力正在崛起

国产 AI Infra 变革进行时:新势力正在崛起
作者丨朱可轩编辑丨陈彩娴近日,“源神”Deepseek 密集开源了一系列代码库,包括FlashMLA、DeepEP、DeepGEMM、DualPipe 等项目及 3FS 系统,几乎实现了对 AI In ...

为什么是梁文锋做出了DeepSeek?

为什么是梁文锋做出了DeepSeek?
这是2025年开年最火的科技明星,短短几天时间,梁文锋从小到大的种种过往都被展现在世人眼前,包括他来不及装修的新房以及在房子里睡觉用的帐篷,都成为了他独特个性的象征。独特个性固然为人津津乐道,但并不是 ...

视频生成赛道再添“猛将”,智谱清影正式上线

视频生成赛道再添“猛将”,智谱清影正式上线
年初Sora横空出世,验证了Scalling Law在视频生成方面的有效性。但Sora始终止步于公开的60秒demo,产品落地计划迟迟未有公开。随后的半年时间,不少“玩家”继续在AI视频生成赛道展开角 ...

对话UCL青年教授赵湖斌:可穿戴式DOT如何重塑脑机接口

对话UCL青年教授赵湖斌:可穿戴式DOT如何重塑脑机接口
我们应当如何实时监控自己大脑的健康状态?以马斯克的Neuralink为代表的侵入式脑机接口,过植入大脑皮层的线状电极直接读取神经信号,实现了高精准度信号采集和脑际交互。但是,侵入式脑机接口方案的风险也 ...

实测丨年底了,我用 AI 做了一份年终总结。

实测丨年底了,我用 AI 做了一份年终总结。
去年11月,自由画布在百度世界大会上首次亮相,各种 AI 新招式也是吊足了人们的胃口。经过了一段时间的等待,我终于拿到了它的内测资格,成为了首批探索者。激动之余,我和自由画布的相关负责人讨教了一下用法 ...

推特热帖:k1.5 很牛,因为借鉴了 UCLA 与 CMU 合作团队的这项技术

推特热帖:k1.5 很牛,因为借鉴了 UCLA 与 CMU 合作团队的这项技术
2025 年 1 月 20 日 Kimi k1.5 正式发布,伴随着技术报告的公布,有网友表示:“这应该是全球范围内,除 OpenAI 之外的公司首次实现 o1 正式版的多模态推理性能了吧!”一时间, ...
返回顶部