搜索
当前所在位置:首页 >> 娱乐

【郑州师范大学偷拍视频体验】WAIC 2025|阶跃发布新一代基模 Step 3:原生多模态,推理效率行业领先

发布时间:2025-09-13 17:22:35 作者:qb 点击:795 【 字体:

在2025世界人工智能大会(简称“WAIC 2025”)开幕前夕,阶跃基模阶跃星辰今天在上海正式发布了新一代基础大模型——Step 3。发布

作为阶跃的新代先主力基座模型,Step 3兼顾智能与效率,原生业领旨在面向推理时代打造最适合应用的多模模型。Step 3将于7月31日面向全球企业和开发者开源,态推郑州师范大学偷拍视频体验为开源世界贡献最强多模态推理模型。理效率行

同时,阶跃基模阶跃星辰还宣布联合多家国内领先的发布芯片、平台厂商发起成立“模芯生态创新联盟”,新代先将通过推动模型和芯片产业链联合创新,原生业领加速大模型应用的多模落地。

此外,态推阶跃星辰与上海国有资本投资有限公司达成深度战略合作,理效率行将围绕加强资本链接、阶跃基模生态业务合作等方面进行全面的深度合作。

作为一家以实现通用人工智能(AGI)为目标的基础大模型公司,阶跃星辰始终专注于基础大模型的上海中学门事件推荐研发,持续推进模型的技术迭代。阶跃星辰创始人、CEO姜大昕表示:

“从Step 1到Step 2两代基模的快速迭代,促使我们深入思考什么才是最适合应用的模型。随着大模型进入到强化学习发展阶段,新一代推理模型成为主流,模型性能的提升固然显著,但这是否完全等同于模型价值?面对这一产业之问,我们必须回归客户需求,立足真实应用场景,探索模型创新落地的可行路径。这是我们研发新一代Step 3基础模型的出发点。”

 WAIC 2025|阶跃发布新一代基模 Step 3:原生多模态,推理效率行业领先


新一代基模 Step 3:推理时代最适合应用的模型

随着大模型技术迈向推理时代,阶跃星辰提出,最适合实际应用的大模型需要满足强智能、低成本、可开源和多模态四个特征。这四个维度缺一不可,因为单点能力强,无法满足用户对于模型的综合需求。唯有模型全面发展,才能让模型真正用起来。基于这样的研发理念,阶跃星辰打造了新一代基模Step 3,专为追求性能与成本极致均衡的企业和开发者设计:

  • 不妥协的性能:原生多模态,性能达到开源SOTA

Step 3是阶跃星辰首个全尺寸、原生多模态推理模型,兼顾模型效果与推理成本,是在模型架构创新、算法工程协同设计上的一次大胆尝试与Scale Up。Step 3采用 MoE 架构,总参数量 321B,激活参数量 38B。

Step 3拥有强大的视觉感知和复杂推理能力,可准确完成跨领域的复杂知识理解、数学与视觉信息的交叉分析,以及日常生活中的各类视觉分析问题。Step 3在MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench (2024.08-2025.05) 等榜单上取得了开源多模态推理模型的SOTA成绩。

WAIC 2025|阶跃发布新一代基模 Step 3:原生多模态,推理效率行业领先

  •  极致成本效益:系统架构创新,推理效率行业领先

在确保性能的前提下,阶跃星辰持续推进模型成本优化。在推理时代,模型性能随思维链的增长而提升,解码效率因此成为降低成本的关键。目前,主流开源模型虽然针对解码进行了大量优化,但其优化方案主要适配国际高端芯片,在中端及国产芯片上的解码效率仍有提升空间。

Step 3旨在通过系统性的技术创新,实现模型降本增效的目标。在架构设计阶段,Step 3便充分考量系统与硬件的特性,实现广泛硬件平台上的高效推理。凭借系统和架构创新,Step 3实现了行业领先的推理解码效率。

根据原理分析,Step 3在国产芯片上的推理效率最高可达DeepSeek-R1的300%,且对所有芯片友好。在基于 NVIDIA Hopper 架构的芯片进行分布式推理时,实测Step 3相较于 DeepSeek-R1的吞吐量提升超70%。这些都是在不牺牲激活参数量、不降低注意力容量的条件下实现的。

这些结果充分验证了 Step 3具备广泛的普适性,在多种硬件环境下部署,均能显著地降低推理成本。

 WAIC 2025|阶跃发布新一代基模 Step 3:原生多模态,推理效率行业领先

目前,Step 3已授权国内多家芯片公司,并完成了芯片适配。同时,Step 3将于7月31日正式面向全球企业和开发者开源,为开源世界贡献最强的多模态推理模型。Step 3已经通过开源技术报告,与全球开发者分享了大幅降低推理成本背后的系统架构创新。(Step 3 Tech report地址:https://github.com/stepfun-ai/Step3)

  • “1+N” 模型矩阵:全方位满足用户需求

成立两年多以来,阶跃星辰构建起“1+N”的Step系列大模型矩阵。“1”是指Step 3基础大模型;“N”则为Step系列的多模态大模型矩阵,广泛覆盖语音、视觉理解、图像编辑、图像和视频生成、音乐等领域。

本次WAIC期间,阶跃亦升级了多模态模型,包括阶跃首个多模理解生成一体化模型Step 3o Vision,第二代端到端语音大模型Step-Audio 2。目前,所有这些模型都可以在“阶跃AI”官网(stepfun.com)和 “阶跃AI” App(应用商店搜索下载)进行体验。


全产业链联合创新,让大模型真正用起来

要让大模型真正能用起来,需要从模型、芯片、平台到应用的全产业链协同创新。 

阶跃星辰宣布联合近10家芯片及基础设施厂商,共同发起“模芯生态创新联盟”,致力于打通芯片、模型和平台全链路技术。通过底层联合创新提升大模型适配性和算力效率,该联盟将为企业和开发者提供高效易用的大模型解决方案,加速应用落地。雷峰网(公众号:雷峰网)

该联盟的首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。目前,华为昇腾芯片已首先实现Step 3的搭载和运行。沐曦、天数智芯和燧原科技等也已初步实现运行Step 3。其它联盟厂商的适配工作正在开展。

WAIC 2025|阶跃发布新一代基模 Step 3:原生多模态,推理效率行业领先

发布会还宣布了上海国有资本投资有限公司与上海阶跃星辰智能科技有限公司的深度战略合作,双方将围绕加强资本链接、生态建设、业务协同、应用赋能等方面进行全面的深度合作。上海国投生态体系将在近期参与投资阶跃星辰的最新一轮融资。

阶跃星辰战略性聚焦智能终端Agent的方向,重点布局汽车、手机、IoT设备等关键应用场景,目前头部客户效应显著:已覆盖国内超过一半头部国产手机厂商,深度合作打造手机 Agent体验;联合吉利推出AI智能座舱,成功实现行业内端到端语音大模型首次量产上车。

另一方面,阶跃星辰积极拓展垂直行业的应用,与金融财经、内容创作、零售等领域的行业头部公司深度合作,共同打造面向 C 端的场景化应用体验。雷峰网

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

WAIC 2025|阶跃发布新一代基模 Step 3:原生多模态,推理效率行业领先

阅读全文
相关推荐

中国等国能否说服俄罗斯谈判?外交部回应

中国等国能否说服俄罗斯谈判?外交部回应
中国和其他全球南方国家能否说服俄罗斯停止升级战争、坐下来谈判?外交部回应2025年9月10日外交部发言人林剑主持例行记者会,部分内容如下:乌通社记者:昨天,俄罗斯军队对顿涅茨克地区的亚罗瓦村发动空袭。 ...

CNCC 落幕:国产大模型已经进化到能在横店给我们点咖啡

CNCC 落幕:国产大模型已经进化到能在横店给我们点咖啡
今年到CNCC现场参会的朋友,想必都对CNCC 2024举办所在地——超过6200亩的横店圆明新园印象深刻!虽然园内建筑身临其境,并且薅了主办方一把羊毛,免门票游览了圆明新园与横店多个著名旅游景点,但 ...

特斯拉首款无人驾驶 RobotTaxi,升级版 Optimus 还是画大饼?

特斯拉首款无人驾驶 RobotTaxi,升级版 Optimus 还是画大饼?
北京时间 10 月 11 日上午,特斯拉在洛杉矶华纳兄弟工作室召开“We, Robot”演示活动,给我们带来了两款全新的自动驾驶汽车和更多关于人形机器人的畅想。早在两个星期前,马斯克就早早高调预告,“ ...

实测字节豆包·视频生成模型:Sora画的饼被实现了......

实测字节豆包·视频生成模型:Sora画的饼被实现了......
过去3个月中国厂商在AI视频赛道已经杀疯了。从快手可灵到Minimax海螺AI、生数科技Vidu、智谱清影,每个AI视频产品的发布都在全球范围内获得广泛认可。并且由于Sora的超长期货行为,在看到中国 ...

2023 IDEA大会开幕 共探AI新篇章下的技术创新与创业

2023 IDEA大会开幕 共探AI新篇章下的技术创新与创业
11月22日,AI与数字经济领域一年一度的科创盛会,2023IDEA大会在深圳举行。IDEA研究院创院理事长、美国国家工程院外籍院士沈向洋在会上发表主旨演讲,发布IDEA研究院的重磅研产结晶与市场化成 ...

联想黄山:「超智融合」成算力新趋势,联想打造异构智算平台

联想黄山:「超智融合」成算力新趋势,联想打造异构智算平台
9月24日至26日,第20届CCF全国高性能计算学术年会CCF HPC China 2024)在武汉市中国光谷科技会展中心正式开幕。本次大会上,联想以“异构智算 稳定高效”为主题,携“一横五纵”算力基 ...

阿里AI旗舰应用夸克发布全新“AI相机” 提升AI超级框多模态能力

阿里AI旗舰应用夸克发布全新“AI相机” 提升AI超级框多模态能力
4月27日,夸克AI超级框发布全新AI相机,上新“拍照问夸克”功能。基于视觉理解与思考推理的强大模型能力,夸克AI超级框从视觉出发创新下一代搜索体验,进一步理解和回答物理世界中的各类问题。作为阿里巴巴 ...

ICLR 2025:顶尖科学家最关心的 AI 趋势有哪些?丨GAIR Live

ICLR 2025:顶尖科学家最关心的 AI 趋势有哪些?丨GAIR Live
自 GPT-4 发布至今已有两年,但对大语言模型的研究并没有放缓,我们仍处在一个技术进步涌现的时代。Anthropic 于 2024 年11月发布 MCP,成为接通 AI 生态的桥梁,自主的 Agen ...

OpenAI 终于发布 GPT

OpenAI 终于发布 GPT
美国时间 7 月18 日,OpenAI 正式发布了多模态小模型 GPT-4o mini,在海内外引起了广泛关注。此前,OpenAI 凭借 GPT-3 开拓了 AI 模型的“暴力美学”时代,同时也以训练 ...

Agent 要被吃进大模型了

Agent 要被吃进大模型了
今天凌晨,奥特曼突然发文宣布推出自家最新的 o 系列模型:满血版 o3 和 o4-mini,同时表示这两款模型都可以自由调用 ChatGPT 里的各种工具,包括但不限于图像生成、图像分析、文件解释、网 ...

英伟达团队发布最新具身模型 Cosmos

英伟达团队发布最新具身模型 Cosmos
英伟达 GTC 大会热度飙升。继黄仁勋在英伟达大会上发布基础世界模型 Cosmos 引发业内讨论后,英伟达团队近日又发布了一个新的物理世界大模型:Cosmos-Reason1。作为 Cosmos 系列 ...

阿里 AI 实力获斯坦福权威报告盖章!通义千问贡献排名全球第三、中国第一

阿里 AI 实力获斯坦福权威报告盖章!通义千问贡献排名全球第三、中国第一
近日,斯坦福大学人工智能研究所发布了最新一期《2025年人工智能指数报告》。研究报告显示,在2024年度全球重要大模型中,中国贡献15项。从具体机构分布来看,谷歌与OpenAI各占7席并列榜首,阿里巴 ...
返回顶部