搜索
当前所在位置:首页 >> 休闲

【高校后台泄露匿名上传】Meta 重金抢人,明星云集就能复制 DeepSeek 的成功吗?

发布时间:2025-09-13 17:22:35 作者:qjky 点击:549 【 字体:

最近 AI 圈最大的重金制新闻,大约就是抢人 Meta 扎克伯格亲自出手、重金招人的明星消息了。根据公开信息,云集如今在小扎亲自出手的成功推动下,Meta 已经组建起一支堪称豪华的重金制高校后台泄露匿名上传 AI 战队。

核心领导团队方面,抢人包括前 Scale AI 创始人 Alexandr Wang(现任 Meta 首席 AI 官)、明星前 GitHub CEO Nat Friedman,云集以及 Safe Superintelligence 联合创始人 Daniel Gross,成功三人共同执掌 Meta Superintelligence Labs 的重金制战略与节奏。

技术阵容同样令人瞩目。抢人Meta 从 OpenAI 挖来了多位重量级研究员,明星包括 GPT-4o 的云集语音与图像模块开发者 Shuchao Bi 和 Huiwen Chang,“思维链”(Chain-of-Thought)技术代表人物 Trapit Bansal,成功以及 GPT 系列模型的重要研发成员 Ji Lin、Shengjia Zhao、Hongyu Ren 和 Jiahui Yu 等人。

而在 OpenAI 之外,Meta 同样高价吸引了 Apple 和 DeepMind 的核心人才:包括 Apple Foundation Models 负责人 Ruoming Pang(据称签约价高达 2 亿美元),DeepMind 前研究员 Jack Rae 与 Pei Sun,以及来自 Anthropic 的 Joel Pobar 和 Sesame AI 的 Johan Schalkwyk,也都陆续加盟。

而网传 Meta 的最新挖人动向,则是他们又成功挖走了 OpenAI 的两员大将,分别是隐秘会所按摩服务 Jason Wei 和 Hyung Won Chung。

其中 Jason Wei 曾在 OpenAI 主导参与了 o1/o3 系列模型及 deep research 项目,是强化学习的坚定拥护者,同时也是 2022 年“Emergent Abilities”(涌现能力)概念的开创者之一。他在思维链(Chain-of-Thought)等前沿技术上的贡献广受认可。而 Hyung Won Chung 同样是 OpenAI 的核心研究员,深度参与了 o1 系列与 deep research 项目,研究方向主要聚焦于推理能力(reasoning)与智能体(agents)。

Meta 重金抢人,明星云集就能复制 DeepSeek 的成功吗?

据报道,目前两人的 OpenAI 内部 Slack 账号已被注销,基本坐实了离职消息。更惊人的是,据称 Meta 为吸引这两位 AI 顶尖科学家,直接开出了高达 3 亿美元的四年期薪酬包,可见其对“超级智能”战略的重视与投入之大。

不少人感慨“大厂要拼命了”“AI 人才再次供不应求”,但也有人冷静指出:大家关注的不是 Meta 的产品愿景、人才密度,而是它开出的高薪。

这就很耐人寻味,为什么我们对“只要聚集足够多聪明人就能做出伟大成果”这件事不再那么有信心了?

因为,现实一次次证明:人多、人强≠结果好。

世界大战中,团队比个人重要

OpenAI 推出 ChatGPT 时,所有人都关注它的技术、以及背后的组织力,但由于当时 OpenAI 云集的世界知名大神很多,所以组织力的归因占比还不算最突出。但在 DeepSeek 这样一个神秘又主要凝聚中国本土 C9 高校学者的团队冒出后,所有人都无法再忽视这样的一个事实:

在像 AGI 这样的大规模团队作战形式中,个人能力拔尖不如组织能力拔尖重要。

回顾人工智能的发展史,曾像 Meta 一样集结超多杰出人才的团队不胜枚举:MSRA、DeepMind、谷歌、百度、智源……乃至大模型时代,近两年腾讯、字节也都曾组织过各个方向的杰出人才组成大团队,但最终都要么人才四散而去、要么组织目标由高降低、要么做出一两件大新闻后泯然众人。

背后的原因众多,有企业的文化架构问题,有行业变化影响,但往往也容易出现一个普遍的现象,即:优秀人才之间的离散与斗争。

最终,强人集合没有产生加倍的效果,反而天才之间可以互相抵消。

每个牛人都有一套成熟的认知系统、经验路径和话语权构建逻辑,而伟大的突破往往来自对路径的反常识性挑战。如果组织没有“容错机制”,牛人越多,分歧越大,行动越慢。

一群彼此不服、各自为营的聪明人凑在一起,容易像一场永不散场的学术讨论会,而不是一个能落地的工程团队。

DeepSeek 是一个有意思的反例。它没有明星科学家,没有学术巨擘撑场,成员年轻,团队规模小(基础研究员在 150 人左右)、扁平化、没有打卡、没有层层 KPI 管理,创始人亲自下场撸代码,文化更像一个纯粹的研究小组。

直到推出 V3,外界还认为它只是在“巨人肩膀上摘果子”,但当 R1 发布、实现推理性能超越时,它直接被推到了行业第一梯队。

DeepSeek 的成功,并不是因为他们“比别人更聪明”,而是因为他们“比别人更敢干、更能协同”。从组织的角度来看,DeepSeek 几乎反其道而行:

极致扁平:没有层层结构,没有 KPI 内卷,反而激发了探索欲。

投入纯粹:大家都在搞基础研究,不用分心“交付”“商业”“报表”。

执行高效:一群动手能力超强的人每天都在干正事,不在做汇报。

认知一致:没有“上下级权威差”,只有“想清楚再动手”的共识。

对比之下,过去两年,字节 Seed 的团队曾一度多达 1000 人,大模型创业公司的基础模型团队虽控制在一百来人的规模、但同样要背负商业交付与产品支持的压力,因此难以构建起“高信任、低管理、强动机”组织模型。最终,DeepSeek 的第一轮胜出,几乎是注定的。

组织力 ≠ 人力总和,而是效率乘积

我们很容易陷入“能力总和论”陷阱:觉得一个组织的战斗力 = 每个人的能力总和 × 工作时间。但事实更接近于:组织战斗力 = 协同效率 × 方向一致性 × 持续稳定性。

换句话说:牛人越多,协同越难,任务越复杂,扁平化越重要。

所有大厂与模型团队的人都在看下一轮基础模型的竞争力,一种直觉的观点认为:大厂同样不缺人、不缺钱、不缺卡甚至不缺场景与数据,战斗力也不应该低于 DeepSeek。但如果将不同团队的研究日常作对比,就不难发现,实际上纯以 AGI 为研究目标的团队与复杂大厂之间的差距。

如果将人才的能力水平从 0 到 100 分划分,单人每天平均研究投入时间为 0 到 14 个小时,那么人才组织与产出的公式就可以清晰转化为效率的乘积:

假设在 DeepSeek 团队中,专注基础研究的年轻博士能力可以打 70-80 分,Top 大模型研究选手如张正彦这样基础理论与实践能力兼具的研究员是 100 分,那么 DeepSeek 的整体平均水平约为 85 分。同时 DeepSeek 没有商业化压力,150 人团队可以每天平均集中投入 12 个小时做基础研究。

对比一个千人研究团队的大厂,基础研究人员与工程师的战斗力由高到低不等,加上大团队意味着管理压力大,算平均值 60 分。且由于要花时间做商业化交付与应用产品支持,1000 人的团队平均每人每天可能最多只能投入 6 个小时做基础研究。

那么基础研究总投入来看,DeepSeek 与大厂的对比实际是:150*85*12 VS 1000*60*6。

除了客观可量化的投入,组织效率、协同成本、执行张力这些更难量化的变量,也是决定战斗力的关键。

如果 DeepSeek 拥有近乎满分的执行效率,记作 1.0,而大厂在目标分散、协作链条冗长等影响下,组织效率只有 0.2,那最终真正释放出来的有效产出会是:

DeepSeek:153000 × 1 = 153000

大厂团队:360000 × 0.2 = 72000

如此来看,其实不难发现 Deepseek 在基础问题的研究投入与产出预期上,实际上是比大厂要多得多。

这也就解释了,为什么 DeepSeek 一个 150 人的小团队,反而能做出一鸣惊人的成果,而一些大厂的千人团队,却因为组织结构复杂、任务重心分散,反而削弱了在基础研究上的真实投入。

再次回到 Mate 花大钱买人的这个事情上,其中有一个非常容易被忽视的变量:动机的成分到底是什么?

Meta 的超高薪能买来聪明人,但买不来“持续愿意干活”的动机。DeepSeek 为什么让人愿意拼 14 个小时?不是因为钱给得最多,而是因为愿景真实、结构自由、成果看得见。

如果动机只建立在薪水上,个体会进入“被动等待回报”的状态,但如果动机来自共创、掌控感和对问题的真实兴趣,反而会激发内驱。

而 Meta、Google 等大型科技公司的问题在于——他们的组织系统已经高度僵化,即使有牛人加入,也只能发挥一小部分。

除了被忽视的动机成分外,人们也经常会误解“创新”是由最聪明的人做出来的。但其实,创新更多发生在边缘人群、结构松散的小团队中。

另一个容易被忽视的客观事实是:随着人工智能的发展时间拉长、各种开源技术的发展,AGI 的知识门槛也在不断降低——这就意味着,十年前只有 AI 技术大牛才能研究出来的算法,如今一个 985 高校的硕博生沉下心来也能钻研明白、探究清楚,并提出大胆的改进设想了。

据 AI 科技评论了解,即使是 Transformer 这样的权威主流架构,国内的 MiniMax、Rock AI 等团队在敢于修改注意力机制后也能取得较大的创新,且在这些团队中主导架构修改的研究人员都并非以往行业追捧的顶级技术明星。

这也是 DeepSeek 给整个行业的启示:与其追求明星团队,不如追求执行团队;与其拼大模型预算,不如拼问题沉淀和反馈机制;与其堆博士、挖大牛,不如形成一个真正愿意彼此合作、共同思考的小集体。

Meta 很难复制 DeepSeek

回到问题本身,雷峰网认为或许 Meta 很难复制 DeepSeek。不是说 Meta 没有足够的钱,而是 Meta 已经不是一个“可变”的组织。

DeepSeek 是一个不断试错的小机器,相比之下 Meta 就是一个巨型飞轮,一旦启动,就很难偏航。组织的惯性,才是最难被打败的东西。

Meta 的高薪策略背后,其实反映出一种焦虑:他们需要重建早期 OpenAI 的文化,但用的是“招聘+绩效+话语权”的老一套工具。这套系统能招来人,但无法召唤真正的协作精神。

归根结底,人工智能行业目前最迫切的或许是打破“聪明人多就能赢”的迷信——聪明人当然重要,但关键是这些聪明人能不能真正协同起来,有没有共识,有没有足够多的自由去试错,甚至是有没有愿意亲自写代码的创始人... ...

雷峰网(公众号:雷峰网)认为在这轮 AI 创新浪潮中,组织的重构能力可能比模型的进步还要重要。

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

Meta 重金抢人,明星云集就能复制 DeepSeek 的成功吗?

阅读全文
相关推荐

苹果大模型最新论文:AFM 模型多维度评测「出炉」

苹果大模型最新论文:AFM 模型多维度评测「出炉」
编译 | 朱可轩编辑 | 陈彩娴不久前,苹果在全球开发者大会WWDC)上推出了最新个人智能系统 Apple Intelligence,可以深度集成到 iOS 18、iPadOS 18 和 macOS ...

无问芯穹完成近 5 亿元 A 轮融资,累计融资近 10 亿元

无问芯穹完成近 5 亿元 A 轮融资,累计融资近 10 亿元
9月2日,无问芯穹Infinigence AI)宣布完成近5亿元A轮融资,本轮融资联合领投方为社保基金中关村自主创新专项基金君联资本担任管理人)、启明创投和洪泰基金。跟投方包括联想创投、小米、软通高科 ...

动易科技获千万级融资;曝 OpenAI 首颗芯片:台积电 1.6nm,为 Sora 定制;阶跃星辰上线图像生成大模型丨AI情报局

动易科技获千万级融资;曝 OpenAI 首颗芯片:台积电 1.6nm,为 Sora 定制;阶跃星辰上线图像生成大模型丨AI情报局
今日融资快报人形机器人动易科技完成千万级融资,峰瑞资本和Z基金领投成立于2024年6月的动易科技完成数千万元天使轮融资,由峰瑞资本和Z基金智谱生态基金)领投,多家知名投资机构跟投。公司由具备丰富足式人 ...

阿里领投首家人形机器人:逐际动力完成亿元 A 轮融资;谷歌 Eureka AI 模型提前曝光丨AI情报局

阿里领投首家人形机器人:逐际动力完成亿元 A 轮融资;谷歌 Eureka AI 模型提前曝光丨AI情报局
今日融资快报通用机器人公司逐际动力完成亿元A轮融资:逐际动力是一家通用机器人公司,专注于具身智能与足式机器人的研发和制造,产品包括人形双足、四轮足机器人及相关软硬件解决方案。创始人张巍是南方科技大学长 ...

于朦胧坠楼传闻后节目疑被替换

于朦胧坠楼传闻后节目疑被替换
9月11日,@于朦胧 坠楼相关消息冲上热搜,目前暂无官方回应。记者注意到,原显示将于9月12日晚20:05分在央视一套播出的节目《宗师列传·大宋词人传-1柳永》现已更换,当前显示9月12日晚20:05 ...

宇树亮相2024世界机器人大会,王兴兴解答人形机器人规划

宇树亮相2024世界机器人大会,王兴兴解答人形机器人规划
2024年8月21日,北京亦庄举行了盛大的2024世界机器人大会。宇树公司凭借强大的技术实力和创新成果在会场上展露头角,带来了消费级四足机器人Go2和它的新型号Go2-W轮足版本,工业级四足机器人B2 ...

AI 手术平台 Caresyntax 获 1.8 亿美元融资;智元发布 5 款商用人形机器人,开发者还能“0元购”丨AI情报局

AI 手术平台 Caresyntax 获 1.8 亿美元融资;智元发布 5 款商用人形机器人,开发者还能“0元购”丨AI情报局
今日融资快报AI手术平台Caresyntax获1.8亿美元C+轮融资caresyntax致力于促进特定医疗环境如外科手术、介入放射检查及产科)更加智能和安全。其推出的解决方案利用物联网、数据分析和人工 ...

发布三个月,豆包大模型综合能力提升20.3%,应用落地再提速

发布三个月,豆包大模型综合能力提升20.3%,应用落地再提速
8月21日,火山引擎AI创新巡展在来到上海。此次巡展会,火山引擎发布了豆包大模型的一系列产品升级,并携手多点 DMALL 成立零售大模型生态联盟。火山引擎总裁谭待表示,较3个月前,最新版豆包大语言模型 ...

对话汇智智能:AI 智能体时代,数字营销范式在革新

对话汇智智能:AI 智能体时代,数字营销范式在革新
作者丨孙溥茜编辑丨陈彩娴大模型浪潮正在以它的方式蚕食着传统数字营销,改变都发生在你我生活的边边角角地方。2023年初,电竞被正式列为奥运会电子竞技项目;随着直播带货的火爆,相比淘宝,抖音电商后来居上。 ...

国内首个!商汤科技发布“日日新5o”,实时多模态流式交互对标GPT

国内首个!商汤科技发布“日日新5o”,实时多模态流式交互对标GPT
2024年7月5日,上海——2024世界人工智能大会暨人工智能全球治理高级别会议WAIC 2024)战略合作伙伴商汤科技召开“大爱无疆·向新力”人工智能论坛,发布国内首个所见即所得模型“日日新5o”, ...

四个月融两轮,千寻智能获 2 亿元天使轮融资;大模型公司卓世科技获亿元人民币 B+ 轮融资;小鹏机器手首次亮相丨AI情报局

四个月融两轮,千寻智能获 2 亿元天使轮融资;大模型公司卓世科技获亿元人民币 B+ 轮融资;小鹏机器手首次亮相丨AI情报局
今日融资快报四个月融两轮,具身智能机器人公司千寻智能获得2亿人民币天使轮融资千寻智能创始人兼CEO韩峰涛在机器人行业拥有十余年丰富经验,曾任珞石机器人联合创始人&CTO,是国内高性能轻型工业机 ...

百川智能完成 50 亿元 A 轮融资,北上深国资入局;OpenAI 挑战谷歌,发布 AI 搜索 SearchGPT丨AI情报局

百川智能完成 50 亿元 A 轮融资,北上深国资入局;OpenAI 挑战谷歌,发布 AI 搜索 SearchGPT丨AI情报局
今日融资快报百川智能完成50亿元A轮融资,北上深国资入局 百川智能是在2023年4月成立的第一批国内AI大模型公司,由前搜狗公司CEO王小川创立。其核心团队由来自搜狗、Google、腾讯、百度、华为、 ...
返回顶部