发布时间:2025-09-13 17:28:39 作者:df 点击:1 【 字体:大中小 】
8月2日,新王新超lmsys官方在推特发布一则消息,登基度更恭喜DeepMind研发的新王新超Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena排名登顶,超越GPT 4o和Claude-3.5夺得第一。登基度更
这是新王新超继今年3月Claude 3 “超大杯”Opus版本短暂超越GPT-4以来,OpenAI第二次让出Chatbot Arena的登基度更警花工作中走光高清视频Overall ranking宝座。
Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena测试一周后。获得了超过12,登基度更000个社区投票,新王新超在Chatbot Arena和Vision Leaderboard排名上均取得了第一名的登基度更好成绩。之前说GPT-4o有刷分技巧,新王新超现在看起来Gemini 1.5 Pro可能也学到了这个技巧呢。登基度更
Gemini 1.5 Pro 实验版(0801)不仅在综合表现上极为突出,在各个细分领域上也有着出色的表现。它在数学方面排名前三,小红书素人美女吐槽合集合集指令遵循排名前二,编码排名前五,硬提示(英语)排名前五。
Gemini 1.5 Pro 实验版(0801)具有强大的多语言能力,在中文、日语、德语、俄语方面均表现第一。
从总体胜率图上,也能看出Gemini 1.5 Pro 实验版 (0801)实力强劲,对阵 GPT-4o 的胜率为 54%,对阵 Claude-3.5-Sonnet 的胜率为 59%。
前OpenAI的开发者,现Google AI Studio的产品负责人Logan Kilpatrick火速转发,向大家宣布Gemini 1.5 Pro 实验版(0801)目前在 LMSYS 的文本和多模式排名中均位居第一的好消息。
DeepMind的CEO Demis Hassabis也转发了这条消息,祝贺Gemini 1.5 Pro 实验版(0801)能够在极具竞争力的榜单中拿下第一,并且宣布这一版本的已经可以在 AI Studio上进行试用。
带领研发Gemini的Jeff Dean也随后转发,对此次实验版本的Gemini 1.5 Pro突破1300+elo分数拿下排名第一的好消息感到非常自豪,也很期待未来能看到其他更好的模型。
听闻这则消息,其他从业人员也纷纷发来祝贺。
也有不少人分享自己的试用体验。大神elvis对在聊天机器人领域超越了 GPT-4o 和 Claude 3.5 Sonnet的Gemini 1.5 Pro非常感兴趣。elvis分享了自己的测试全过程视频,并总结道,Gemini 1.5 Pro强大的图像和PDF提取能力给他留下了深刻的印象,Gemini 1.5 Pro有着和GPT-4o不相上下的视觉能力,也有Claude 3.5 Sonnet接近的代码生成及PDF理解/推理能力。
有人认为Gemini 1.5 Pro在解决高级数学难题方面表现相当不错。
也有人说Gemini 1.5 Pro在图像识别植物和动物方面做得确实要比GPT 4o更好。
也有更多的人在期待Gemini 1.5 Pro这一版本的正式上线,希望能够API实现Gemini 1.5 Pro的实际运用。
大家对Gemini 1.5 Pro这次发布的实验版本有什么看法,欢迎评论区留言分享~雷峰网雷峰网(公众号:雷峰网)
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
商汤坐上大模型核心牌桌
谁将替代 Transformer?
AI推理芯片,大模型「下半场」的入场券
CMU 最新研究:Gemini 综合不敌 ChatGPT,谷歌还需努力
王威廉最新创业项目:世界上第一个用于芯片设计和验证的 AI 智能体来了
国产端侧小模型超越 GPT
AI推理芯片,大模型「下半场」的入场券
被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线
实测丨年底了,我用 AI 做了一份年终总结。
苹果发布多模态模型 Ferret
国产端侧小模型超越 GPT
月之暗面“自卷”,Kimi智能助手官宣支持200万字无损上下文
曝阶跃星辰正在进行估值20亿美元融资;OpenAI放宽股票限制;Suno和Udio遭三大唱片公司起诉丨AI情报局
百川智能首款 AI 应用主打懂搜索,但王小川不做搜索 2.0
从 0 到 1,揭秘中国首个 AI 音乐 SOTA 模型
零一万物 API 上线,用户反馈多模态中文能力超过 GPT
阿里云造「生态」,能让开发者实现「大模型创业自由」吗?
亮点剧透丨大模型产业应用如何落地,WAIC 探讨技术突破与最新实践
体育中考「上难度」,视觉 AI 下场「减负」
元象首个多模态大模型 XVERSE
墨西哥拟对有关贸易伙伴提高进口关税税率 商务部回应
专访联想集团 CTO 芮勇:智能体是具身智能的基础|具身智能十人谈
比 Sora DiT 架构早两个月的 U
史上最快AI芯片Sohu获1.2亿美元融资;Groq进行估值25亿美元融资;Mac版ChatGPT开放下载丨AI情报局
Hammerspace携手驿心科技,为中国打造超大规模AI存储解决方案
元象首个多模态大模型 XVERSE
牵手五大顶尖高校教授 “云阙智能”打造AIGC智囊团
与大模型交手近 1500 天,智源仍在坚持原始创新
类ChatGPT新玩家「商量」入场,商汤如何「日日新」?
「焦虑」的体育教育,「救场」的AI体育
对话零一万物:大模型产品要找到 TC
若愚科技:基于多模态大模型的机器人“大脑”领导者
Demis Hassabis荣获诺贝尔化学奖,网友:诺奖需要AI
MediaTek 举办天玑开发者大会 MDDC2024,携手产业伙伴共创生成式 AI 新生态
别再说国产大模型技术突破要靠 Llama 3 开源了
博搏云的生态蓝图:稳固住AGI全栈服务商的重要阵地