发布时间:2025-09-13 13:44:43 作者:uukm 点击:3474 【 字体:大中小 】
5月27日,蚂蚁模态在蚂蚁技术日上,集团蚂蚁集团旗下的官宣百灵大模型(Ling)团队宣布正式开源统一多模态大模型Ming-lite-omni。据蚂蚁方面介绍,开源这是统多一款基于Ling-lite构建的MoE架构的全模态模型,其总参数22B,大模西安中学实拍评论激活参数3B。蚂蚁模态
据悉,Ming-lite-omni当前模型权重和推理代码已开源,官宣后续会陆续开源训练代码和训练数据。开源
https://huggingface.co/inclusionAI/Ming-Lite-Omni
今年以来,统多百灵大模型已经连续开源了多个模型产品,大模包括2个MoE架构的蚂蚁模态北京师范大学泄露全集大语言模型,Ling-lite和Ling-plus,集团多模态大模型Ming-lite-uni,官宣以及Ming-lite-omni-preview。
其中,其中五月中旬开源了Ling-lite-1.5,据百灵方面介绍,“能力已经接近同水位SOTA水平,介于千问4B和8B的水平。”蚂蚁方面称,这两个模型在多个算力平台(包括非Hopper架构的国产算力)进行训练,验证了300B尺寸的SOTA MoE大语言模型在非高端算力平台上训练的可行性。
而本次开源的Ming-lite-omni产品在多项理解和生成能力评测中,性能与10B量级领先的多模态大模型相当或更优。蚂蚁方面认为,这是目前已知首个在模态支持方面能够与GPT-4o相媲美的开源模型。
百灵大模型负责人西亭对媒体表示,百灵大模型的命名规则是Ling代表基础大模型,Ring代表推理版本,Ming代表多模态大模型。百灵在过去主要在几个方面做了聚焦,一个是很早做MoE架构的探索,坚定的在语言大模型和多模态大模型上面统一使用了MoE的架构,同时使用了大量非高端的算力平台,证明了国产GPU的“也能训练出来可比拟GPT4o的模型”。其次,百灵很重视多模态领域的探索,一直在推进多模态的生成和理解的统一,而本次开源的Ming-lite-omin即是过去技术探索的成果。
百灵方面表示,团队下一步将持续优化Ming-lite-omni在全模态理解和生成任务上的效果,并提升Ming-lite-omni的多模复杂推理能力;同时也会训练更大尺寸的全模态模型Ming-plus-omni。此外,根据西亭透露, 百灵还在筹备Ling的Max版本,发布节点将会是“追寻跟(deepseek)V3的版本差不多的版本时开出去”。
(雷峰网(公众号:雷峰网))
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
娃哈哈旗下多家公司近期更名为宏胜
南方电网发布首个「电力大模型」,百度智能云助力「智能电网」
数据,真的是 AI 大模型市场化的「壁垒」吗?
ChatGPT 加持,决策大模型距离 AGI 更进一步
英伟达团队发布最新具身模型 Cosmos
【ICIG 2023】聚力创新,共赢未来,第十二届国际图象图形学学术会议圆满落幕
超百万 B 端月活用户,ZMO.AI 用 AIGC 打开营销的潘多拉魔盒
动态丨李志飞退回出门问问,“拖家带口”能做好大模型吗?
阿里云林伟:关于大模型时代 AI 工程建设的思考丨GAIR 2023
【ICIG 2023】聚力创新,共赢未来,第十二届国际图象图形学学术会议圆满落幕
AI 也能被 Cosplay,太强了
将港中文建成中国计算机视觉黄埔军校的人
大模型时代下的数字安全答案,藏在一本实战指南里
AIGC:我不是元宇宙的附庸品
OpenAI 最强对话模型 ChatGPT: 用户已破百万,落地将有几何
Gair 大咖说:AI 的兴起是否意味着 Web3 的衰落?
阿里云为什么要押注 Coding AI
NVIDIA与全球工作站厂商共同推出用于生成式AI及LLM开发、内容创作和数据科学的强大系统
何恺明 MIT 最新演讲:未来工作将聚焦 AI for science
SCOW 首次亮相 HPC China 2022,以算网融合助力“东数西算”工程发展
别再说国产大模型技术突破要靠 Llama 3 开源了
开源启智,筑梦未来!第四届OpenI/O启智开发者大会开幕
CNCC 12月8日全线上召开,逾万注册参会者在线聚,直播人气近200万
“寒冬”还是“拂晓”?第四范式成功上市率先交卷
戴盟机器人王煜:「具身技能」才能发挥人形机器人的作用
周志华当选新一任国际人工智能联合会(IJCAI)理事会主席
对话特斯联华先胜:不迷信大模型,现阶段的革新仍在「交互」
王慧文的光年之外开张,四家大模型抢开发布会,新科技革命如火如荼
AI 迈进深水区,谈落地、谁能带来新解法?
Gair 大咖说:AI 的兴起是否意味着 Web3 的衰落?
砖家:轻量化网络利好红米
将港中文建成中国计算机视觉黄埔军校的人
拳打可灵,脚踢 Veo 3,谁是物理世界的「懂王」?
GAIR 大咖说:大模型改变世界,从一场「Chat」革新开始
通用3D机器视觉平台是不是伪命题?
字节的大模型野心,藏在一艘「方舟」里