搜索
当前所在位置:首页 >> 热点

【苏州高中偷拍视频攻略】面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

发布时间:2025-09-13 17:37:17 作者:ca 点击:3799 【 字体:

[雷峰网(公众号:雷峰网)]两周前,面壁面壁发布领先的新模型早开源大模型「Eurux-8x22B 」。相比口碑之作 Llama3-70B,于L越发布时间更早,比肩综合性能相当,理超尤其是面壁苏州高中偷拍视频攻略拥有更强的推理性能——刷新开源大模型推理性能 SOTA,堪称开源大模型中「理科状元」。新模型早激活参数仅 39B,于L越支持 64k 上下文,比肩相比 Llama3 速度更快、理超可处理更长文本。面壁

面壁新模型:早于Llama3、新模型早比肩 Llama3、于L越推理超越 Llama3!比肩

图注:面壁Eurux-8x22B 模型在 LeetCode 和 TheoremQA这两个具有挑战性的基准测试中,刷新开源大模型推理性能 SOTA。

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

图注:面壁Eurux-8x22B 模型综合性能比肩 LlaMa3-70B,超越开源模型 WizardLM-2-8x22b, Mistral-8x22b-Instruct,DeepSeek-67b,以及闭源模型 GPT-3.5-turbo。

 

Eurux-8x22B 由 Mistral-8x22B对齐而来。强劲战斗力,来自面壁 Ultra 对齐技术上新 UltraInterat 大规模、高质量对齐数据集。此前,面壁 Ultra 对齐系列数据集已经“强壮”了全球超 200 个大模型,堪称大模型上分神器。

 

Eurux-8x22B模型+对齐数据集,全家桶开源:

https://github.com/OpenBMB/Eurus

https://huggingface.co/openbmb/Eurux-8x22b-nca

开源大模型「理科状元」

开源大模型「理科状元」

复杂推理能力是体现大模型性能差异的最核心能力之一,也是大模型真正落地应用所需的关键能力所在。

Eurux-8x22B 在代码和数学等复杂推理的综合性能方面超越 Llama3-70B,刷新开源大模型 SOTA,堪称「理科状元」。特别在 LeetCode (180道LeetCode真题)和 TheoremQA(美国大学水准的STEM题目)这两个具有挑战性的基准测试中,超过现有开源模型。

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

图注:Eurux-8x22B 在代码和数学等复杂推理综合性能方面超越 Llama3-70B,刷新开源大模型 SOTA。


开源大模型「理科状元」Eurux-8x22B在实际应用中表现如何呢?


在近期 LeetCode 周赛,这一检验人类程序员编程能力的真实竞技场上:Eurux-8x22B 在 Python 编程方面取得综合排名超越了80% 的人类参赛选手的优秀成绩,成功解决四道算法题中的三道,可以初步通过互联网大厂的程序员编程面试。


下面是本次周赛中Eurux-8x22B对一道中等难度的算法题的真实解答:

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!


除了代码能力优秀,Eurux-8x22B 解答数学题也是轻而易举。


例如给它一道高中排列组合题,Eurux-8x22B 首先给出了清晰的解题思路,然后一步步地拆解执行,再进行结果汇总,最后得到正确答案。

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

再考察它一道代数题,Eurux-8x22B 直击要害,运用二项式定理,清晰简洁地给出了正确的解答。

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

接着给它一道向量代数题,Eurux-8x22B 也能轻松拿下。

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

高考函数题可能是令很多人回忆起来就头疼的一类题,Eurux-8x22B 也能解答无误。

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

(需要说明的是,Eurux-8x22B 没有针对中文语料进行额外的微调和对齐!)

面壁 Ultra 对齐技术,大模型上分神器!

本次大模型「理科状元」 Eurux-8x22B 的优异表现,得益于来自面壁 Ultra 对齐技术的大规模、高质量对齐数据集UltraInteract上新。

好数据,才有好模型。此前,面壁 Ultra 对齐技术已经“强壮”了全球超 200 个大模型,堪称大模型上分神器。

 ➤  UltraInterat对齐数据集地址:

? https://github.com/OpenBMB/Eurus

UltraInteract是专门设计用于提升大模型推理能力的大规模、高质量的对齐数据集,包含了覆盖数学、代码和逻辑推理问题的12个开源数据集的86K条指令和220K偏好对,共有五十万(条)左右数据。相比而言,LLaMA 3-70B模型则是使用了千万量级的对齐数据,这从侧面证明了 UltraInteract 数据集的优质性——数据质量胜过数据数量。UltraInteract 数据集开源后在社区受到了广泛好评。

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

从领先的端侧模型「小钢炮」MiniCPM,到开源模型推理新 SOTA 的Eurux-8x22B,为什么面壁智能总能推出同等参数、性能更优的「高效大模型」?答案是,大模型是一项系统工程,而面壁作为国内极少数兼具大模型算法与 infra 能力的团队,拥有自研的全流程高效生产线:面壁 Ultra 对齐技术、Infra 工艺、独家「模型沙盒」实验和现代化数据工厂,从数据、训练到调校工艺环环相扣,一条优秀的大模型Scaling Law增长曲线由此而生。

Infra工艺方面,面壁构建了全流程优化加速工具套件平台ModelForce,可以实现 10 倍推理加速,90% 成本降低。

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

算法方面,通过上千次以上的「模型沙盒」实验,探索更加科学的训模方法。以小见大,寻找高效模型训练配置,实现模型能力快速形成。

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

➤  Eurux-8x22B模型GitHub地址:

https://github.com/OpenBMB/Eurus

 ➤  Eurux-8x22B模型HuggingFace地址:https://huggingface.co/openbmb/Eurux-8x22b-nc

 ➤  UltraInterat对齐数据集地址:

https://github.com/OpenBMB/Eurus





雷峰网版权文章,未经授权禁止转载。详情见转载须知。

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

阅读全文
相关推荐

王慧文的光年之外开张,四家大模型抢开发布会,新科技革命如火如荼

王慧文的光年之外开张,四家大模型抢开发布会,新科技革命如火如荼
作者丨何思思编辑丨林觉民1光年之外开张,王慧文喊出:“加速AGI,普惠人类”光年之外在这天正式开张。其开工仪式尤为有趣,王慧文带着马占凯、刘江、袁进辉等创业团队成员一起吃了个蛋糕。这一天,王慧文也在朋 ...

首发丨原阿里 VP 司罗加入 Salesforce

首发丨原阿里 VP 司罗加入 Salesforce
近期Salesforce在大模型上亦有新动作。作者 | 郭思编辑 | 陈彩娴AI 科技评论获悉:知名人工智能科学家司罗从阿里巴巴离职后,已在去年 10 月加入了新公司。根据司罗的领英资料显示,从202 ...

国产 AI 作画神器来了!日增 5 万用户的背后有什么秘诀?

国产 AI 作画神器来了!日增 5 万用户的背后有什么秘诀?
以文生图,漫画日更几十页不是梦! 作者 |王玥、施方圆编辑 | 陈彩娴就在最近,生成式 AI 又火了,这次是国内的平台!9月,一个叫做「盗梦师」的微信小程序悄悄上线,却一鸣惊人,达成日增5万新用户的纪 ...

DALL·E 3 推理能力炸裂提升,OpenAI 抢跑「ChatGPT 原生」

DALL·E 3 推理能力炸裂提升,OpenAI 抢跑「ChatGPT 原生」
时隔一年半,OpenAI 直接玩了个大的,把文生图和 ChatGPT 做了结合,带着最新版本 DALL·E 3 来了。DALL·E 3 的巨大飞跃主要体现在两大方面。第一,只需要提示词,ChatGPT ...

Lydia 动作大模型亮相,虚拟动点助力“利亚德集团2024年生态合作伙伴大会”

Lydia 动作大模型亮相,虚拟动点助力“利亚德集团2024年生态合作伙伴大会”
随着「百模大战」进入白热化阶段,通用大模型的优势和弊端都已渐渐显露。与此同时,能应用在特定行业的垂直大模型,具备优越的落地场景,有更多来自市场的切实需求。利亚德集团的动作大模型便是行业垂直大模型的代表 ...

首发丨原阿里 VP 司罗加入 Salesforce

首发丨原阿里 VP 司罗加入 Salesforce
近期Salesforce在大模型上亦有新动作。作者 | 郭思编辑 | 陈彩娴AI 科技评论获悉:知名人工智能科学家司罗从阿里巴巴离职后,已在去年 10 月加入了新公司。根据司罗的领英资料显示,从202 ...

新加坡国立大学尤洋:高性能 AI 的突破丨GAIR 2023

新加坡国立大学尤洋:高性能 AI 的突破丨GAIR 2023
过去数年,AI 模型的参数发生了极大变化。尤洋指出,从 2016 年至 2021 年 1 月,AI 模型的参数量是每 18 个月增长 40 倍;从 2018 年 1 月到 2021 年 1 月,AI ...

AI 迈进深水区,谈落地、谁能带来新解法?

AI 迈进深水区,谈落地、谁能带来新解法?
技术发展是一个持续叠进的过程,AI 也是如此。经历过去 70 年的“三起两落”,近年来,人工智能行业迈进深水期,分工细化,产业落地成为主旋律,AI 与各个场景的交叉、对话不断在发生。对不少企业而言,以 ...

WAIC 2025 主论坛演讲 | MiniMax 创始人闫俊杰:每个人的 AI

WAIC 2025 主论坛演讲 | MiniMax 创始人闫俊杰:每个人的 AI
2025世界人工智能大会WAIC)于今日在上海开幕。作为全球人工智能领域的顶级盛会,本届大会以“智能时代 同球共济”为主题,汇聚全球智慧,展现中国方案。活动首日,MiniMax创始人、CEO闫俊杰先生 ...

实测:ChatGPT的翻译能力怎么样?

实测:ChatGPT的翻译能力怎么样?
在今天,狂热追捧ChatGPT,仿佛已经成为了一种“政治正确”。ChatGPT一出,学界、工业界无不惊为天人。一位研究机构的资深研究员就对AI科技评论说过:“ChatGPT出来,直接给我们整不会了—— ...

老友眼中的于朦胧:读书时就有“男神范”,走红后也重情重义

老友眼中的于朦胧:读书时就有“男神范”,走红后也重情重义
9月11日,青年演员、歌手于朦胧坠楼身故,引发网友痛惜。于朦胧为2013年《快乐男声》选秀全国十强,在《太子妃升职记》《三生三世十里桃花》等剧中,以清新俊逸的古装扮相赢得不少观众喜爱。11日晚,南都N ...

“寒冬”还是“拂晓”?第四范式成功上市率先交卷

“寒冬”还是“拂晓”?第四范式成功上市率先交卷
作者丨孙溥茜编辑丨陈彩娴AI科技评论消息,今天,第四范式以“6682”为股票代码,正式在香港联合交易所挂牌上市。第四范式是从去年年底大模型浪潮兴起以来首家成功上市的国内AI公司。值得注意的是,第四范式 ...
返回顶部