搜索
当前所在位置:首页 >> 焦点

【天津中学内幕下载】元象首个多模态大模型 XVERSE

发布时间:2025-09-13 14:05:48 作者:wqxh 点击:7561 【 字体:

元象首个多模态大模型 XVERSE-V 开源,元象刷新权威大模型榜单,多模支持任意宽高比输入


人类获取的信息83%来自视觉,图文多模态大模型能感知更丰富和精确的元象真实世界信息,构建更全面的多模认知智能,从而向AGI(通用人工智能)迈出更大步伐。模型天津中学内幕下载

元象今日发布多模态大模型 XVERSE-V ,元象支持任意宽高比图像输入,多模在主流评测中效果领先。模型该模型全开源,元象无条件免费商用 ,多模持续推动海量中小企业、模型研究者和开发者的元象研发和应用创新。

XVERSE-V 性能优异,多模在多项权威多模态评测中超过零一万物Yi-VL-34B、模型面壁智能OmniLMM-12B及深度求索DeepSeek-VL-7B等开源模型,在综合能力测评MMBench中超过了谷歌GeminiProVision、西安医科大学内幕价格阿里Qwen-VL-Plus和Claude-3V Sonnet等知名闭源模型。

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入
图. 多模态大模型综合评测



1

融合整体和局部的高清图像表示

传统的多模态模型的图像表示只有整体,XVERSE-V  创新性地采用了融合整体和局部的策略,支持输入任意宽高比的图像。兼顾全局的概览信息和局部的细节信息,能够识别和分析图像中的细微特征,看的更清楚,理解的更准确。

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

注:Concate* 表示按列进行拼接

这样的处理方式使模型可以应用于广泛的领域,包括全景图识别、卫星图像、古文物扫描分析等。

示例- 高清全景图识别 、图片细节文字识别

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

免费下载大模型

  • Hugging Face:https://huggingface.co/xverse/XVERSE-V-13B

  • ModelScope魔搭:https://modelscope.cn/models/xverse/XVERSE-V-13B

  • Github:https://github.com/xverse-ai/XVERSE-V-13B

  • 问询发送:opensource@xverse.cn

商业合作

微信添加:lixing_lixing

元象持续打造国内开源标杆,在国内最早开源最大参数65B 、全球最早开源最长上下文256K  以及  国际前沿的MoE模型, 并在SuperCLUE测评全国领跑。此次推出MoE模型, 填补国产开源空白,更将其 推向了国际领先水 平。

商业应用上,元象大模型是 广东最早获得国家备案的模型之一  ,可向全社会提供服务。元象大模型去年起已和多个腾讯产品,包括 QQ音乐  、虎牙直播、全民K歌、腾讯云等,进行深度合作与应用探索,为文化、娱乐、旅游、金融领域打造创新领先的用户体验。

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入



2

 多方向实际应用表现突出

模型不仅在基础能力上表现出色,在实际的应用场景中也有着出色的表现。具备不同场景下的理解能力,能够处理信息图、文献、现实场景、数理题目、科学文献、代码转化等不同需求。

  • 图表理解

不论是复杂图文结合的信息图理解,还是单一图表的分析与计算,模型都能够自如应对。

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

  • 视障真实场景

在真实视障场景测试集VizWiz中,XVERSE-V 表现出色,超过了InternVL-Chat-V1.5、DeepSeek-VL-7B 等几乎所有主流的开源多模态大模型。该测试集包含了来自真实视障用户提出的超过31,000个视觉问答,能准确反映用户的真实需求与琐碎细小的问题,帮助视障人群克服他们日常真实的视觉挑战。

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

VizWiz测试示例

  • 看图内容创作

XVERSE-V 具备多模态能力的同时保持强大的文本生成能力,能够很好胜任理解图像后创造性文本生成的任务。

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入 

  • 教育解题

模型具备了广泛的知识储备和逻辑推理能力,能够识别图像解答不同学科的问题。

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

  • 百科解答

模型储备了历史、文化、科技、安全等各类主题的知识。

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

  • 代码撰写

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

  • 自动驾驶

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

  • 情感理解与识别

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

元象公司介绍
               

一元复始,万象更新。元象 XVERSE 于 2021 年初在深圳成立,是国内领先的 AI 与 3D 技术服务公司,致力于打造 AI 驱动的 3D 内容生产与消费一站式平台,愿景为“定义你的世界”。

元象创始人姚星是前腾讯副总裁和腾讯 AI Lab 创始人、国家科技部新一代人工智能战略咨询委员会成员。元象累计融资金额超过 2 亿美元,投资机构包括腾讯、高榕资本、五源资本、高瓴创投、红杉中国、淡马锡和CPE源峰等。

元象获国家“专精特新”、“高新技术企业”认证,团队目前有75%为研发人员(60%为硕博学历)。公司积极推动前沿技术自主研发,在3D领域,自研行业引领性的“端云协同” 3D 互动技术,开创零门槛(轻)、一站式(快)、高品质(美)全新 3D 体验;在AI领域,公司最早开源国内最大参数大模型(650亿)、世界最长上下文长度(256K)在内的一系列高性能大模型,免费可商用,将国产开源提升至国际一流水平,积极推动大模型国产可替代和行业应用发展。

元象已经为多家龙头企业提供一站式技术与服务,包括:澳门大三巴、南京大报恩寺、央视、腾讯音乐TMELAND、华为、一汽大众、阿迪达斯、中国平安、中科院深圳先进院等。

公司注册名:深圳元象信息科技有限公司

官网:www.XVERSE.cn

官微:元象 XVERSE

Logo下载

链接: https://pan.baidu.com/s/1fB-zoITVJZ7Znv5IVe-fZg 

提取码: rav0 

雷峰网(公众号:雷峰网)


雷峰网版权文章,未经授权禁止转载。详情见转载须知。

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

阅读全文
相关推荐

代码大模型+金融场景:aiXcoder入选TiD 2025年度软件研发优秀案例

代码大模型+金融场景:aiXcoder入选TiD 2025年度软件研发优秀案例
2025年7月10日——基于代码大模型的aiXcoder智能化软件开发解决方案,凭借其技术创新和在国有银行的落地应用实践,入选TiD 2025质量竞争力大会“2025年度软件研发优秀案例”。在该案例中 ...

OPPO「小布」的主动式智能进化

OPPO「小布」的主动式智能进化
作者丨王晓然编辑丨陈彩娴1智能助手,是AI的天然训练场如果要总结2022年AI领域十大关键词,「主动智能」必然上榜,且提及的高频场景一定聚焦于:智能家居、车机、手机。而穿插在这三个场景之间的,有一个无 ...

DALL·E 3 推理能力炸裂提升,OpenAI 抢跑「ChatGPT 原生」

DALL·E 3 推理能力炸裂提升,OpenAI 抢跑「ChatGPT 原生」
时隔一年半,OpenAI 直接玩了个大的,把文生图和 ChatGPT 做了结合,带着最新版本 DALL·E 3 来了。DALL·E 3 的巨大飞跃主要体现在两大方面。第一,只需要提示词,ChatGPT ...

李开复宣布筹组中文版 ChatGPT 公司“Project AI 2.0”

李开复宣布筹组中文版 ChatGPT 公司“Project AI 2.0”
作者丨New Bing编辑丨AI科技评论1背景3月19日下午4点半,创新工场董事长兼CEO李开复在朋友圈宣布,正在亲自筹组Project AI 2.0,这是创新工场塔尖孵化即先在策略层面设定特定技术主 ...

反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了
2 月 16 号,马斯克在 X 上发布了一条自家 Grok 3 模型的发布预告。并配文“地球上最聪明的 AI”要来了。北京时间 2025 年 2 月 18 日中午,马斯克如约带领着 xAI 的工程师和 ...

南方电网发布首个「电力大模型」,百度智能云助力「智能电网」

南方电网发布首个「电力大模型」,百度智能云助力「智能电网」
9月26日,南方电网人工智能公司正式发布了电力行业人工智能创新平台及自主可控电力大模型。据悉,电力行业人工智能创新平台提供模型即服务MaaS),支持模型快速迭代开发,支撑电力人工智能资源面向全社会开放 ...

数据,真的是 AI 大模型市场化的「壁垒」吗?

数据,真的是 AI 大模型市场化的「壁垒」吗?
数据的重要性之于人工智能技术发展长期存在。但在大模型以前,鲜少有人能预见它背后巨大的想象力。作为智能飞跃中的关键一环,ChatGPT 火爆全球后,“模型-用户数据-模型迭代-用户数据”的飞轮式迭代,令 ...

港科大褚晓文:医疗场景下的 AutoML ,模型参数量更小、分类准确率更高

港科大褚晓文:医疗场景下的 AutoML ,模型参数量更小、分类准确率更高
探索 AI 和医学结合更多的可能性,是人工智能发展的一个重要命题。AutoML 作为近年来备受瞩目的概念之一,被视为解决算法工程师来提高训练模型效率的一个工具,在工业、农业、零售等诸多场景中均有被使用 ...

奥特曼热捧华人AI制药公司获3.72亿美元融资;李开复称若AI取代工作,可以代言生发广告;AGI或使全球GDP翻倍丨AI情报局

奥特曼热捧华人AI制药公司获3.72亿美元融资;李开复称若AI取代工作,可以代言生发广告;AGI或使全球GDP翻倍丨AI情报局
融资快报Formation Bio宣布完成3.72 亿美元D轮融资:Formation Bio原名为TrialSpark)由华人Benjamine Liu和Linhao Zhang共同创立,是一家专注 ...

一场关于ChatGPT话语权的深度思考:人类会在大模型中迷失自我吗?

一场关于ChatGPT话语权的深度思考:人类会在大模型中迷失自我吗?
作者丨Elizabeth Weil译者丨ChatGPT编辑丨孙溥茜ChatGPT 之风愈演愈烈,华盛顿大学语言学家 Emily M. Bender 公开反对让大模型LLM)过度介入人们的生活。谷歌和亚 ...

「深度学习+」时代,百度画出了这张 AI 工业大生产的蓝图

「深度学习+」时代,百度画出了这张 AI 工业大生产的蓝图
作者 | 李梅编辑 | 陈彩娴1764年的一天,“珍妮纺纱机”诞生在英国一个织工哈格里夫斯的家中,将织布效率提高了八倍,吹响了人类进入机器时代的号角。很快,这股“机器之风”就吹到了采煤、冶金、制造、交 ...

AI 迈进深水区,谈落地、谁能带来新解法?

AI 迈进深水区,谈落地、谁能带来新解法?
技术发展是一个持续叠进的过程,AI 也是如此。经历过去 70 年的“三起两落”,近年来,人工智能行业迈进深水期,分工细化,产业落地成为主旋律,AI 与各个场景的交叉、对话不断在发生。对不少企业而言,以 ...
返回顶部