搜索
当前所在位置:首页 >> 风汇风

反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

发布时间:2025-07-12 09:02:59 作者:jx 点击:6197 【 字体:

2 月 16 号,反超马斯克在 X 上发布了一条自家 Grok 3 模型的克钞发布预告。

并配文“地球上最聪明的砸出k终 AI”要来了。

北京时间 2025 年 2 月 18 日中午,于上马斯克如约带领着 xAI 的反超工程师和研究团队开启了 Grok 3 的首发实况。

这次发布会主要分为三个部分,克钞南京医科大学爆料下载介绍了 Grok 3 在训练上比 Grok 2 多投入了 10 倍的砸出k终计算资源,解锁了更强大的于上计算能力,展示了基于 Grok 3 的反超 AI Agent,展现了 xAI 团队在自主智能体领域的克钞最新进展。

反超 DeepSeek?砸出k终马斯克「钞能力」砸出来的 Grok 3 终于上线了

各项能力一骑绝尘

“我们非常高兴能够推出 Grok3,我们认为,于上苏州师范大学偷拍评价在很短的反超时间内,它的克钞功能比 Grok2 强大一个数量级。这要归功于一支不可思议的砸出k终团队的辛勤工作,我很荣幸能与这样一支优秀的团队合作。”马斯克在发布会上说道。

马斯克还透露,Grok 3 由 Colossus 超级计算机训练完成,这台计算机是在短短八个月内建成的,搭载了 10 万颗英伟达 H100 GPU,提供了超过 2 亿 GPU 小时的计算资源——是 Grok 2 的10倍。

据 xAI 团队介绍,xAI 最开始搭建这个 10 万 GPU 集群用了 122 天,后续拓展到 20 万  GPU 集群仅用了 92 天。显著的算力提升让 Grok 3 能够更高效地处理庞大信息集,缩短训练时间。随即他们便晒出了一组和 ChatGPT 的信息对比图,并表示虽然 Grok 起步较晚,但在 MMLU 得分上以超快地速度追上了 ChatGPT。

反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

并且 Grok3 在 LMSYS(大模型竞技场)中的排名也是一骑绝尘。

反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

其中 Grok-3 和 Grok-3 mini 在多方面性能上都超过或媲美 Gemini、DeepSeek 和 ChatGPT 等对手。

发布会列出的信息显示,Grok-3 和 Grok-3 mini 在数学、科学和编程的基准测试中,表现超越了所有主流模型,包括 GPT-4、Claude 3.5 Sonnet、DeepSeek-V3 和 Gemini-2 Pro等。

而 Grok-3 Reasoning Beta 和 Grok-3 mini Reasoning 这两个版本,则凭借强大的推理能力,超越了像 DeepSeek-R1 和 OpenAI o3 mini 等推理模型。

反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

此外,xAI团队还现场演示了一个任务,要求Grok-3在现场生成一段关于太空发射的3D动画代码。在大约两分钟的思考后,Grok 3生成了可直接运行的Python代码,成功展示了可以运行的3D动画。

除此之外团队还要求 Gork-3 制作一款类似于俄罗斯方块和宝石迷阵的游戏。在Grok-3 思考了数分钟后,给出了答案。

最后,xAI 团队演示了一个全新的产物,基于 Grok 3 的搜索引擎 —— DeepSearch 。

它不仅能够搜索网页并查找现有资料,还能“推测客户的真实意图”并进行思考。通过交叉对比多个信息源,它能够确保“返回最准确的答案”。

Grok 3 搅动 AI 大模型格局

实况结束后,不少网友纷纷发声。

AI 大牛卡帕西总结了一下自己的“先行版”使用体验:

首先 Grok 3 的“思考”功能非常先进,能够出色地解决复杂问题,如创建《卡坦岛》风格的棋盘游戏网页。相比之下,其他顶级模型(如 DeepSeek-R1、Gemini 2.0 Flash Thinking、Claude)未能解决相同问题。除此之外,Grok 3 也能尝试解决如黎曼假设等难题。

其次 Grok 3还具备类似“深度研究”的搜索功能,能够提供高质量的研究问题答案。例如,它能够回答 Apple 新品发布、Palantir 股价上涨等问题。但在某些情况下,它会错误地产生幻觉(如错误的URL或不准确的事实)。

最后在测试一些简单的“陷阱”问题时,Grok 3 表现良好,能够正确回答一些逻辑谜题。但在幽默和道德问题方面,它仍然存在一些问题,如生成重复笑话和对复杂伦理问题过于敏感等。

但总的来说 Grok 3 整体表现接近 OpenAI 的 o1-pro 模型,并略优于 DeepSeek-R1 和 Gemini 2.0 Flash Thinking。

反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

Imarena.ai 官方更是在经过测试后发文称:

Grok-3 是首个突破 1400 分的模型,在所有类别中排名第一,这是一个越来越难以实现的里程碑。

反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

更有网友直呼:Grok 3 可能是现实世界中在物理层面处理得最好的基础大语言模型了!当然也有网友在测试之后,认为 Grok 3 在编程方面并不是很擅长。

值得一提的是,Grok 3 第一批获得访问权限的人将首先从 X 上的 Premium+ 订阅者开始,而普通客户何时能用上,他们也并不清楚。

但基于网友们对 Grok 3 褒贬不一的评价,雷峰网(公众号:雷峰网)不禁猜测,这被 “钞能力” 风风火火砸出来的的 “no.1” 在权限全面放开之后会不会口碑两极反转,亦或是依旧好评如潮,稳坐 AI 大模型王座?

时间还早,让子弹再飞一会。

参考链接:https://x.com/i/broadcasts/1gqGvjeBljOGB?t=SX_aTsBoXc07lfSR_Aw8AQ&s=09

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

阅读全文
相关推荐

抖音精品喜剧系列短剧全数上线,喜人卡司领衔主演笑点无限

抖音精品喜剧系列短剧全数上线,喜人卡司领衔主演笑点无限
来源标题:抖音精品喜剧系列短剧全数上线,喜人卡司领衔主演笑点无限近日,抖音联合美团出品的精品喜剧系列短剧《葬礼后我竟成大哥卧底》正式上线。自今年年初起,由《喜人奇妙夜》高人气演员参演的《陛下,你走错片 ...

亚马逊 8000 万美元收购 Perceive AI;昆仑万维发布首个 AI 短剧平台;百川智能成立新公司丨AI情报局

亚马逊 8000 万美元收购 Perceive AI;昆仑万维发布首个 AI 短剧平台;百川智能成立新公司丨AI情报局
今日融资快报AMD以49亿美元收购服务器制造商ZT Systems据报道,AMD已同意以49亿美元现金和股票交易收购人工智能基础设施集团ZT Systems,此举延续了该芯片公司在人工智能领域的投资势 ...

当人形机器人开始走进车厂

当人形机器人开始走进车厂
作者丨赖文昕编辑丨陈彩娴8月21日,汇集了近170家国内外机器人企业的世界机器人大会WRC 2024)在北京如期而至。大会现场上,最受欢迎的主角们便是27款特点鲜明的人形机器人。回顾悄然过半的具身智能 ...

百川智能完成 50 亿元 A 轮融资,北上深国资入局;OpenAI 挑战谷歌,发布 AI 搜索 SearchGPT丨AI情报局

百川智能完成 50 亿元 A 轮融资,北上深国资入局;OpenAI 挑战谷歌,发布 AI 搜索 SearchGPT丨AI情报局
今日融资快报百川智能完成50亿元A轮融资,北上深国资入局 百川智能是在2023年4月成立的第一批国内AI大模型公司,由前搜狗公司CEO王小川创立。其核心团队由来自搜狗、Google、腾讯、百度、华为、 ...

被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线

被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线
大约 1 个月前,马斯克所创办的 xAI 团队宣布开源 Grok-1——一个参数量为 3140 亿的 MoE 大模型。从参数量来看,Grok-1 超越了 70B 的 LLaMA 2,是当前开源模型中最 ...

对话 IJCAI2024 大会主席张成奇:克服了幻觉,大模型就不够「靓丽」

对话 IJCAI2024 大会主席张成奇:克服了幻觉,大模型就不够「靓丽」
作者丨王悦 张进编辑丨陈彩娴第 33 届IJCAI大会在韩国济州岛圆满结束,为期一周8.3-8.9)的 IJCAI 吸引了来自全世界各地人工智能领域的研究者和关注者,大会现场的氛围跟 8 月的济州岛天 ...

联想黄山:「超智融合」成算力新趋势,联想打造异构智算平台

联想黄山:「超智融合」成算力新趋势,联想打造异构智算平台
9月24日至26日,第20届CCF全国高性能计算学术年会CCF HPC China 2024)在武汉市中国光谷科技会展中心正式开幕。本次大会上,联想以“异构智算 稳定高效”为主题,携“一横五纵”算力基 ...

Soul创新多模态互动体验,携「异世界回响」亮相WAIC2024

Soul创新多模态互动体验,携「异世界回响」亮相WAIC2024
7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议WAIC 2024)正式开幕。今年主题为“以工商促共享 以善治促善智”,围绕核心技术、智能终端、应用赋能三大板块,集中展示一批“人工智能+ ...

云南威信县黑龙村强降雨疑似致5人失联

云南威信县黑龙村强降雨疑似致5人失联
据央视新闻消息,7月8日7时至9日14时,云南昭通市遭遇大范围暴雨、局部特大暴雨袭击,其中威信县最大降雨量达254.4毫米,刷新该站点自1958年建站以来的单日最高纪录。据初步排查,威信县罗布镇黑龙村 ...

徐凌杰创立魔形智能,国际头部GPU高管加盟

徐凌杰创立魔形智能,国际头部GPU高管加盟
导语:创业方向是做大模型基础设施。作者丨马蕊蕾编辑丨陈彩娴近日,前「壁仞科技」总裁徐凌杰,离开壁仞4个月后,于2024年6月份,正式成立了上海魔形智能有限公司。据悉,徐凌杰毕业于上海交通大学电子工程系 ...

无问芯穹完成近 5 亿元 A 轮融资,累计融资近 10 亿元

无问芯穹完成近 5 亿元 A 轮融资,累计融资近 10 亿元
9月2日,无问芯穹Infinigence AI)宣布完成近5亿元A轮融资,本轮融资联合领投方为社保基金中关村自主创新专项基金君联资本担任管理人)、启明创投和洪泰基金。跟投方包括联想创投、小米、软通高科 ...

英伟达梦想,富士康模式:Alexander Wang如何用24万数字游民打造数据标注王国

英伟达梦想,富士康模式:Alexander Wang如何用24万数字游民打造数据标注王国
这位世界上最年轻的白手起家的亿万富翁,曾在首次登上福布斯排行榜后迅速跌落,但几年后就重新夺回了这一头衔。给 Alexander Wang 带来这个极具传奇性的名号的,是他的数据工厂—— Scale A ...
返回顶部