搜索
当前所在位置:首页 >> 风趣新

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude

发布时间:2025-07-12 04:20:29 作者:njm 点击:9 【 字体:

8月2日,新王新超lmsys官方在推特发布一则消息,登基度更恭喜DeepMind研发的新王新超Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena排名登顶,超越GPT 4o和Claude-3.5夺得第一。登基度更

这是新王新超继今年3月Claude 3 “超大杯”Opus版本短暂超越GPT-4以来,OpenAI第二次让出Chatbot Arena的登基度更苏州大学实拍推荐Overall ranking宝座。

新王登基,新王新超Gemini 1.5 Pro再度更新,登基度更超越GPT 4o和Claude-3.5

Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena测试一周后。获得了超过12,登基度更000个社区投票,新王新超在Chatbot Arena和Vision Leaderboard排名上均取得了第一名的登基度更好成绩。之前说GPT-4o有刷分技巧,新王新超现在看起来Gemini 1.5 Pro可能也学到了这个技巧呢。登基度更

新王登基,新王新超Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

Gemini 1.5 Pro 实验版(0801)不仅在综合表现上极为突出,在各个细分领域上也有着出色的表现。它在数学方面排名前三,杭州学院爆料地址指令遵循排名前二,编码排名前五,硬提示(英语)排名前五。

Gemini 1.5 Pro 实验版(0801)具有强大的多语言能力,在中文、日语、德语、俄语方面均表现第一。

从总体胜率图上,也能看出Gemini 1.5 Pro 实验版 (0801)实力强劲,对阵 GPT-4o 的胜率为 54%,对阵 Claude-3.5-Sonnet 的胜率为 59%。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

前OpenAI的开发者,现Google AI Studio的产物负责人Logan Kilpatrick火速转发,向大家宣布Gemini 1.5 Pro 实验版(0801)目前在 LMSYS 的文本和多模式排名中均位居第一的好消息。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

DeepMind的CEO Demis Hassabis也转发了这条消息,祝贺Gemini 1.5 Pro 实验版(0801)能够在极具竞争力的榜单中拿下第一,并且宣布这一版本的已经可以在 AI Studio上进行试用。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

带领研发Gemini的Jeff Dean也随后转发,对此次实验版本的Gemini 1.5 Pro突破1300+elo分数拿下排名第一的好消息感到非常自豪,也很期待未来能看到其他更好的模型。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5


听闻这则消息,其他从业人员也纷纷发来祝贺。


新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

也有不少人分享自己的试用体验。大神elvis对在聊天机器人领域超越了 GPT-4o 和 Claude 3.5 Sonnet的Gemini 1.5 Pro非常感兴趣。elvis分享了自己的测试全过程影片,并总结道,Gemini 1.5 Pro强大的图像和PDF提取能力给他留下了深刻的印象,Gemini 1.5 Pro有着和GPT-4o不相上下的视觉能力,也有Claude 3.5 Sonnet接近的代码生成及PDF理解/推理能力。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

有人认为Gemini 1.5 Pro在解决高级数学难题方面表现相当不错。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

也有人说Gemini 1.5 Pro在图像识别植物和动物方面做得确实要比GPT 4o更好。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

也有更多的人在期待Gemini 1.5 Pro这一版本的正式上线,希望能够API实现Gemini 1.5 Pro的实际运用。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

大家对Gemini 1.5 Pro这次发布的实验版本有什么看法,欢迎评论区留言分享~雷峰网(公众号:雷峰网)雷峰网


雷峰网原创文章,未经授权禁止转载。详情见转载须知。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

阅读全文
相关推荐

乌克兰声称已拘留两名中国公民 外交部回应

乌克兰声称已拘留两名中国公民 外交部回应
财联社7月10日电,据环球时报,有记者提问称,乌克兰昨天表示已拘留两名中国公民,指控他们试图将导弹技术走私出境,请问中方对此有何评论?对此,发言人毛宁表示,我们还在核实了解有关情况,如果涉及中国公民, ...

ICLR 2025:顶尖科学家最关心的 AI 趋势有哪些?丨GAIR Live

ICLR 2025:顶尖科学家最关心的 AI 趋势有哪些?丨GAIR Live
自 GPT-4 发布至今已有两年,但对大语言模型的研究并没有放缓,我们仍处在一个技术进步涌现的时代。Anthropic 于 2024 年11月发布 MCP,成为接通 AI 生态的桥梁,自主的 Agen ...

万字实录:VLA 范式,具身智能的曙光与迷雾丨GAIR Live

万字实录:VLA 范式,具身智能的曙光与迷雾丨GAIR Live
整理丨赖文昕编辑丨陈彩娴VLA视觉-语言-动作模型)作为具身智能领域的关键新范式,能有效整合视觉信息、语言指令与行动决策,显著提升机器人对复杂环境的理解和适应能力,对推动机器人从单一任务执行向多样化场 ...

“歌游内蒙古”听乌兰图雅《摘朵马兰你就走吧》围着篝火 唱着想念

“歌游内蒙古”听乌兰图雅《摘朵马兰你就走吧》围着篝火 唱着想念
来源标题:“歌游内蒙古”听乌兰图雅《摘朵马兰你就走吧》围着篝火 唱着想念近日,著名歌手、音乐创作人乌兰图雅以她独有的演唱风格为听众带来一首《摘朵马兰你就走吧》,她干净清澈的嗓音和鲜活跃动的情感表达,为 ...

在 AI 战场里拿掉英特尔,PC 能活吗?

在 AI 战场里拿掉英特尔,PC 能活吗?
ChatGPT引发了一场大模型淘金热。一开始大家扎堆训练大模型。发现入局没有那么简单,发展到第二阶段,就开始出现了寄生于ChatGPT的众多APP和应用。无论是发力于向量数据库缓存,还是支持模型微调以 ...

国家统计局:6月CPI同比上涨0.1%,由降转涨,核心CPI继续回升

国家统计局:6月CPI同比上涨0.1%,由降转涨,核心CPI继续回升
国家统计局城市司首席统计师董莉娟解读2025年6月份CPI和PPI信息。6月份,扩内需、促消费政策持续显效,居民消费价格指数CPI)同比由上月下降转为上涨0.1%;环比下降0.1%,降幅比上月收窄0. ...

反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了
2 月 16 号,马斯克在 X 上发布了一条自家 Grok 3 模型的发布预告。并配文“地球上最聪明的 AI”要来了。北京时间 2025 年 2 月 18 日中午,马斯克如约带领着 xAI 的工程师和 ...

记者:弗拉霍维奇与米兰就待遇问题展开谈判

记者:弗拉霍维奇与米兰就待遇问题展开谈判
来源:实况吧实况吧7月7日讯 记者Marco Conterio报道,弗拉霍维奇与米兰展开谈判。此前消息称,阿莱格里希望再次与弗拉霍维奇合作,因此这位塞尔维亚前锋已经成为米兰今夏的引援目标。而记者表示, ...

欧洲理事会主席与伊朗总统通电话 讨论冲突解决方案

欧洲理事会主席与伊朗总统通电话 讨论冲突解决方案
△欧洲理事会主席科斯塔当地时间7月9日,欧洲理事会主席科斯塔与伊朗总统佩泽希齐扬举行电话会谈。科斯塔称,双方进行了深入交流并一致认为,通过对话解决冲突,是实现和平与稳定的正确途径。佩泽希齐扬表示,伊朗 ...

微软人工智能公开课概览

微软人工智能公开课概览
人工智能无疑是当前最为热门的科技概念。作为科技界的领军企业,微软在人工智能领域耕耘已久。早在25年前微软研究院建立时,人工智能就已经成为整个微软的战略目标。微软为此倾注了许多精力和资源,并取得了亮眼的 ...

破解创作密码,解码市场趋势,这场研讨共探精品创作新路径

破解创作密码,解码市场趋势,这场研讨共探精品创作新路径
来源标题:破解创作密码,解码市场趋势,这场研讨共探精品创作新路径近年来,北京网络剧创作成果丰硕。在“北京大视听”品牌引领下,涌现出《我的阿勒泰》《滤镜》《异人之下之决战!碧游村 ...

指数科技AFH技术打造AI生成硬件范式,做垂直领域“刚需”

指数科技AFH技术打造AI生成硬件范式,做垂直领域“刚需”
在2025年中国电子信息博览会CITE)上,深圳人工智能企业——指数科技正式发布其自主研发的AFHAI For Hardware)技术,以"AI生成硬件" 为核心能力,首次实现了从 ...
返回顶部