发布时间:2025-07-12 04:20:29 作者:njm 点击:9 【 字体:大中小 】
8月2日,新王新超lmsys官方在推特发布一则消息,登基度更恭喜DeepMind研发的新王新超Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena排名登顶,超越GPT 4o和Claude-3.5夺得第一。登基度更
这是新王新超继今年3月Claude 3 “超大杯”Opus版本短暂超越GPT-4以来,OpenAI第二次让出Chatbot Arena的登基度更苏州大学实拍推荐Overall ranking宝座。
Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena测试一周后。获得了超过12,登基度更000个社区投票,新王新超在Chatbot Arena和Vision Leaderboard排名上均取得了第一名的登基度更好成绩。之前说GPT-4o有刷分技巧,新王新超现在看起来Gemini 1.5 Pro可能也学到了这个技巧呢。登基度更
Gemini 1.5 Pro 实验版(0801)不仅在综合表现上极为突出,在各个细分领域上也有着出色的表现。它在数学方面排名前三,杭州学院爆料地址指令遵循排名前二,编码排名前五,硬提示(英语)排名前五。
Gemini 1.5 Pro 实验版(0801)具有强大的多语言能力,在中文、日语、德语、俄语方面均表现第一。
从总体胜率图上,也能看出Gemini 1.5 Pro 实验版 (0801)实力强劲,对阵 GPT-4o 的胜率为 54%,对阵 Claude-3.5-Sonnet 的胜率为 59%。
前OpenAI的开发者,现Google AI Studio的产物负责人Logan Kilpatrick火速转发,向大家宣布Gemini 1.5 Pro 实验版(0801)目前在 LMSYS 的文本和多模式排名中均位居第一的好消息。
DeepMind的CEO Demis Hassabis也转发了这条消息,祝贺Gemini 1.5 Pro 实验版(0801)能够在极具竞争力的榜单中拿下第一,并且宣布这一版本的已经可以在 AI Studio上进行试用。
带领研发Gemini的Jeff Dean也随后转发,对此次实验版本的Gemini 1.5 Pro突破1300+elo分数拿下排名第一的好消息感到非常自豪,也很期待未来能看到其他更好的模型。
听闻这则消息,其他从业人员也纷纷发来祝贺。
也有不少人分享自己的试用体验。大神elvis对在聊天机器人领域超越了 GPT-4o 和 Claude 3.5 Sonnet的Gemini 1.5 Pro非常感兴趣。elvis分享了自己的测试全过程影片,并总结道,Gemini 1.5 Pro强大的图像和PDF提取能力给他留下了深刻的印象,Gemini 1.5 Pro有着和GPT-4o不相上下的视觉能力,也有Claude 3.5 Sonnet接近的代码生成及PDF理解/推理能力。
有人认为Gemini 1.5 Pro在解决高级数学难题方面表现相当不错。
也有人说Gemini 1.5 Pro在图像识别植物和动物方面做得确实要比GPT 4o更好。
也有更多的人在期待Gemini 1.5 Pro这一版本的正式上线,希望能够API实现Gemini 1.5 Pro的实际运用。
大家对Gemini 1.5 Pro这次发布的实验版本有什么看法,欢迎评论区留言分享~雷峰网(公众号:雷峰网)雷峰网
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
《遮天》短剧正式开播!掌阅科技引领AI与真人实拍融合创作方向
千寻智能解浚源:具身智能的 Scaling Law 已跨过起跑线丨具身先锋十人谈
泛黄寻人启事暗藏惊天阴谋 《利剑·玫瑰》定档7.28剑指打拐风暴
Agent 要被吃进大模型了
人民日报:不少声音呼吁“同志”称呼重归主流
24小时两见特朗普 以色列总理只为一件事
《新说唱2025》魔王对抗赛:新老对决高潮迭起,多元说唱风格碰撞
对话UCL青年教授赵湖斌:可穿戴式DOT如何重塑脑机接口
问鼎「AI 之巅」,第四届全国人工智能大赛决赛在深举行
魔法吉伊卡哇系列中国大陆线下首发,7月5日起登陆上海百联!
RL 是推理神器?清华上交大最新研究指出:RL 让大模型更会“套公式”、却不会真推理
第三届北京网络视听艺术大会开幕 80部网络视听精品力作发布
吉祥航空通报一航班发动机启动阶段出现机械故障
Hammerspace携手驿心科技,为中国打造超大规模AI存储解决方案
乌镇暑假新推十余项活动,乌镇消夏节疯玩古今江南
上合组织国家电影节闭幕,《三大队》获最佳影片
智谱AI狂飙:与商业化博弈的一年
深谋科技独树一帜,发布高精度压电式六维力传感器「弹起」,满足多领域高动态力控需求
《七月的一天》正式开机 沈月陈昊森携手勇闯漫画世界
三大模型巨头比拼思考“幻觉”:DeepSeek 不敌 ChatGPT,Gemini 用词最少
从 0 到 1,揭秘中国首个 AI 音乐 SOTA 模型
OceanBase一体化架构再升级,业内首发“共享存储”产品
乌镇暑假新推十余项活动,乌镇消夏节疯玩古今江南
Agent 要被吃进大模型了
乌克兰声称已拘留两名中国公民 外交部回应
ICLR 2025:顶尖科学家最关心的 AI 趋势有哪些?丨GAIR Live
万字实录:VLA 范式,具身智能的曙光与迷雾丨GAIR Live
“歌游内蒙古”听乌兰图雅《摘朵马兰你就走吧》围着篝火 唱着想念
在 AI 战场里拿掉英特尔,PC 能活吗?
国家统计局:6月CPI同比上涨0.1%,由降转涨,核心CPI继续回升
反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了
记者:弗拉霍维奇与米兰就待遇问题展开谈判
欧洲理事会主席与伊朗总统通电话 讨论冲突解决方案
微软人工智能公开课概览
破解创作密码,解码市场趋势,这场研讨共探精品创作新路径
指数科技AFH技术打造AI生成硬件范式,做垂直领域“刚需”