搜索
当前所在位置:首页 >> 热点

【深圳医科大学门事件排名】为什么是梁文锋做出了DeepSeek?

发布时间:2025-09-13 17:37:17 作者:wigq 点击:86526 【 字体:

这是梁文2025年开年最火的科技明星,短短几天时间,梁文梁文锋从小到大的梁文种种过往都被展现在世人眼前,包括他来不及装修的梁文新房以及在房子里睡觉用的帐篷,都成为了他独特个性的梁文象征。

独特个性固然为人津津乐道,梁文深圳医科大学门事件排名但并不是梁文成功的关键,这个籍籍无名的梁文大学生,在过去的梁文十几年中所能倚靠的,只有他的梁文思想和能力。

所有人都好奇这样一个问题,梁文为什么是梁文梁文锋做出了DeepSeek?这其中固然有时代的因素,以及他本人迥异于其他大模型研究者的梁文个人经历。但AI科技评论认为,梁文理解梁文锋是梁文个什么样的人,才是理解这个问题的关键。

找人才不需要标签

猎头都觉得,帮梁文锋的公司找人太不容易了。

一位从21年开始就与幻方深度合作的猎头告诉雷峰网(公众号:雷峰网),招人招得让他“想哭”,因为难度太高了。

“清华本博,天津中学曝光地址六篇顶会,你觉得肯定没问题了吧,哎,怎么简历直接挂了;一个清华本科的MIT博士,第二轮面试就被淘汰了。”

如果要在大厂内部找候选人,他认为,幻方和DeepSeek基本上不会对标国内公司,他们只会对标Google和Meta这样的海外大厂。

另外一位猎头一谈到DeepSeek也是忍不住头大,“太挑剔了,推过一个在字节绩效非常好的年轻中层,聊了之后没过。我就很奇怪,去问他们,给我的回答是,这个人对AI没有热情。人家都是做过一些AI Agent相关的项目了,一般是不太会说这样的评价的。”

梁文锋对人才没有标签,不论学历背景,不论过往业绩,他只看这个人的个人能力和个人素质。

极高的人才门槛,造就了如今的DeepSeek。在国内的大模型团队中,DeepSeek的人才厚度可能不足以跟顶尖公司相提并论,但是人才密度绝对可以说得上是第一档。

留住这些人才,除了DeepSeek的高薪酬外,还有充分尊重创意与idea的管理模式。“无固定团队、无汇报关系、无年度计划”与其说是管理,不如说是信任。《奈飞文化手册》一书曾经说过,“优秀的同事和艰巨的挑战是吸引人们来公司工作的最大因素”。对AI从业者而言,再没有比AGI更艰巨的挑战了。

做最难的事,就要找到最好的人,给出充足的资源与信任。得到信任的顶级人才往往会带来巨大的爆发力,这一理论可以在抖音崛起中得到印证。

在2018年春节期间,抖音日新增用户超过千万量级。一位负责增长的产品经理曾提及,这个增长项目完全没有绩效压力,而且向财务发了一封邮件,他的账户中就多出了上亿元的投放预算。他当时就意识到,“这样的团队,做啥打不赢呢?”

DeepSeek也是同理。被筛掉简历的人,一定不是学历问题;面试通不过,肯定也不是能力问题;人才的需求集中为一句话就是,这个人是可以被信任一同为AGI努力的人吗?

这就是DeepSeek的人才观,理解了这种人才观,就是理解梁文锋的第一步。

极简主义的世界观

尽管做了多年量化,但是梁文锋并不认为自己是个做金融的,他对自己的看法是,“我是做AI的,只不过做的是量化场景”。

几乎所有与梁文锋交流过的人,都说出他是一个不会受到外界干扰的人,“他的思维方式极其纯粹,特别注重第一性原理”,“说话很慢”,“一开口就切中要害”。

量化投资的特性恰好契合了他这种极简主义的风格——它不需要与复杂的上下游产业链打交道,只需专注于纯粹的市场数据。

时至今日,梁文锋依然常常沉浸在自己的技术世界中,专注于解决问题。比如做大模型这件事,他会告诉别人,“想清楚了就能干,只要有卡就行”,其他困难不在考虑范围之内。

对待金钱也是如此。钱就是用来投资,或者做慈善事业的,只要能花在合适的地方,亏损并不值一提。

2023年底,曾有一个旨在扶助聋哑人士的手语大模型项目,为了拉投资找到了梁文锋。梁文锋提出,这个项目的优点是公益性突出,缺点是市场规模有限,其中的隐患是,这是一个Top高校大学生团队的项目,他们可能不会长期坚持。

尽管极有可能得不到任何回报,他仍然提出,只要团队愿意继续推进项目,他就愿意投入。

过去梁文锋每年会拿出5亿元用于投资或慈善上,现在他把这笔钱花在了DeepSeek上。炒股是为了挣钱,投入大模型是为了AGI,仅此而已。

DeepSeek有将近两万张卡,他对算力极其慷慨,对上述的手语大模型团队,他就承诺过,算力集群会随时向他们开放。但是他又有点“小气”,对这近两万张卡的利用率要求很高,力求打满,不要空转。

这两种行为看似矛盾,如果按照极简主义的观点来解释,那就行得通了:卡的存在就是为了用的,能用尽用,万勿浪费。

不以商业化为限

没花一分钱投放费用,DeepSeek的App只用7天时间就得到了一个亿用户,对这一奇迹般的增长,梁文锋怎么看?有投资人在春节期间专门问了梁文锋这个问题,但是梁文锋看起来对这么大的流量根本毫不在意,投资人得到的回答是,“这距离AGI的路还很远”。

这并不是梁文锋在故作姿态。据雷峰网了解,DeepSeek只安排了两三个人负责App维护、对话网页开发、以及充值后台的管理工作。所以它不好用是正常的。

DeepSeek在B端市场的种种事迹,流传更广。比如此前他们的私有化部署定价仅为45万元,其中不仅包含一台H20或910b的使用权,还附赠大模型服务,使用期限为一年。而同样的价格,在华为云上仅仅只能租到 910b一年的使用权,这也就意味着 DeepSeek 的大模型近乎免费提供。

私有化部署不挣钱,DeepSeek也不在乎靠API挣不挣钱。一位对接DeepSeek的大厂员工吐槽它有一种“爱用不用”的气质,总是很难用,总是不调整。

再大的客户和调用量,都不值得另眼相看。一切大厂在高峰期都要排队,用户体验很差。大客户的反馈也很多,要求DeepSeek扩容扩容再扩容,至少回应流畅一些,不要两次请求就有一次失败,特别是在客服场景上,这种失败几乎不能忍受。

外界喧喧嚣嚣,不过梁文锋看起来并不是很在意这件事情。

这位大厂员工与DeepSeek员工私下交流过怎么改善这个问题,他得到的回答是,梁文锋认为,大厂完全有能力自己想办法解决请求失败的问题,他们应该自己给自己兜底,而不是过度依赖 DeepSeek来保障服务。

这个回答简直要把他给气笑了,“我们可是DeepSeek的Top级客户。”

可以说,现在的梁文锋不在乎商业化的一切可能。

在不少团队投入到应用的今天,梁文锋曾经跟一个好友说过,“你不要一直去看应用和行业落地的事情,你现在去看只能把你自己禁锢住了,因为没有到时候,现在想的一切都是错的。而且你在错误的路上你还投入了更多时间、精力和钱。”

这是对好友的忠告,也是自己的践行。将精力投入到应用上,投入到商业化上,对梁文锋来说,不论做什么,都是一条错误的道路。

而正确的道路从来只有一条,他现在已经走在了正确的道路上。


雷峰网原创文章,未经授权禁止转载。详情见转载须知。

为什么是梁文锋做出了DeepSeek?

阅读全文
相关推荐

被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线

被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线
大约 1 个月前,马斯克所创办的 xAI 团队宣布开源 Grok-1——一个参数量为 3140 亿的 MoE 大模型。从参数量来看,Grok-1 超越了 70B 的 LLaMA 2,是当前开源模型中最 ...

多模态新旗舰MiniCPM

多模态新旗舰MiniCPM
今天,我们正式开源 8B 参数的面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型,成为行业首个具备“高刷”视频理解能力的多模态模型,看得准、看得快,看得长!高刷视频理解、长视频理解、OCR、文档 ...

AI的风猛吹存储芯片:美光科技、闪迪暴拉七连阳

AI的风猛吹存储芯片:美光科技、闪迪暴拉七连阳
来源:财联社财联社9月12日讯编辑 史正丞)截至美股周四收盘,美国内存芯片公司美光科技大涨7.55%,闪存巨头闪迪Sandisk)拉出一根14%的阳线,两家公司均走出七连阳的暴力拉升节奏。美光科技、闪 ...

拳打可灵,脚踢 Veo 3,谁是物理世界的「懂王」?

拳打可灵,脚踢 Veo 3,谁是物理世界的「懂王」?
一个优秀的多模态视频生成大模型永远是一套复杂的系统级工程,它包括但不限于:跨模态理解与对齐能力,时序一致性的控制能力,精细化的编辑和修正能力,以及高效计算和成本控制的能力等。这让它看起来总像是一个巨头 ...

独家丨知名AI科学家叶杰平、薄列峰,加入阿里达摩院

独家丨知名AI科学家叶杰平、薄列峰,加入阿里达摩院
雷峰网独家消息,近日,达摩院新增两位AI 科学家,原贝壳技术副总裁、首席科学家叶杰平,前京东数科 AI 实验室首席科学家薄列峰已于近日入职阿里,分别担任达摩院城市大脑实验室和XR实验室X Lab)负责 ...

马杜罗:委内瑞拉将在全国284个“前线”地点部署防御力量

马杜罗:委内瑞拉将在全国284个“前线”地点部署防御力量
新华社加拉加斯9月11日电委内瑞拉总统马杜罗11日凌晨在北部拉瓜伊拉州宣布启动“独立200计划”,在全国284个“前线”地点部署军队、警察和民兵。马杜罗说,此次行动遵循国家全面防御战略方针,284个“ ...

胡塞武装证实对以色列发动弹道导弹袭击

胡塞武装证实对以色列发动弹道导弹袭击
当地时间11日晚间,也门胡塞武装发言人叶海亚·萨雷亚发表讲话称,胡塞武装对以色列实施了两项军事行动。首先,使用一枚“巴勒斯坦-2”型高超音速弹道导弹袭击了以色列内盖夫地区的一个军事目标;其次,使用三架 ...

大量无人机进入波兰领空,哪儿来的?

大量无人机进入波兰领空,哪儿来的?
当地时间9日夜间,大量无人机进入波兰领空,波兰军方紧急处置并击落部分无人机。波兰方面称无人机来自俄罗斯。俄方否认这一说法并表示准备与波兰国防部进行磋商。欧洲方面猛烈谴责“俄罗斯侵犯波兰领空”。俄方先前 ...

WAIC 2025|阶跃发布新一代基模 Step 3:原生多模态,推理效率行业领先

WAIC 2025|阶跃发布新一代基模 Step 3:原生多模态,推理效率行业领先
在2025世界人工智能大会简称“WAIC 2025”)开幕前夕,阶跃星辰今天在上海正式发布了新一代基础大模型——Step 3。作为阶跃的主力基座模型,Step 3兼顾智能与效率,旨在面向推理时代打造最 ...

国防部:日本加速军事扩张意欲何为?

国防部:日本加速军事扩张意欲何为?
据报道,日本防卫省公布预算草案显示,2026财年日防卫预算达8.85万亿日元,创历史新高。国防部新闻发言人今天表示,日本加速军事扩张,增长远超“专守防卫”所需的军力,包括进攻性武器装备,不禁让全世界爱 ...

娃哈哈旗下多家公司近期更名为宏胜

娃哈哈旗下多家公司近期更名为宏胜
国家企业信用信息公示系统显示,近日,山西娃哈哈昌盛饮料有限公司名称变更为山西宏胜饮料有限公司。该公司成立于2007年10月,注册资本为1600万美元,法定代表人为祝丽丹,由宗馥莉担任董事,由浙江娃哈哈 ...

墨西哥拟对有关贸易伙伴提高进口关税税率 商务部回应

墨西哥拟对有关贸易伙伴提高进口关税税率 商务部回应
来源:财联社财联社9月11日电,商务部新闻发言人就墨西哥拟对有关贸易伙伴提高进口关税税率事答记者问。有记者问:据报道,墨西哥拟对包括中国在内的未与墨签署自贸协定的国家,将汽车、玩具、钢铁、纺织品和塑料 ...
返回顶部