马斯克揭秘全球顶尖AI大模型Grok-3,震撼发布引热议

在万众瞩目中,马斯克携手xAI团队带来了全球首个在20万块GPU上训练的AI大模型——Grok-3。这一创举不仅标志着AI技术的新里程碑,也迅速在多个排行榜上崭露头角,力压o3-mini(high)和DeepSeek-R1等强劲对手。

马斯克与三位xAI成员通过在线直播,正式官宣了Grok-3的全家桶阵容,包括Grok-3(Beta)、首个推理模型Grok-3 Reasoning(Beta)以及Grok-3 mini Reasoning。据介绍,Grok-3的训练计算量是Grok-2的10倍,依托全球最大超算集群Colossus的20万块GPU,历经两个阶段、共计214天的训练,才最终成就了这一AI巨擘。

在多项基准测试中,Grok-3展现出了惊人的实力,刷新了数学(AIME 2024)、科学问答(GPQA)和编码(LCB)等领域的SOTA记录,大幅超越了DeepSeek-V3、Gemini-2 Pro和GPT-4o等模型。Grok-3 mini的性能同样出色,基本领先或媲美其他闭源/开源模型。在LMSYS Arena排行榜中,Grok-3以超1400的Elo评分位列榜首,无人能敌。

更令人瞩目的是,Grok-3的数学能力几乎能完成大部分美国数学专业能力测试的题目,其推理模型Grok-3 Reasoning在回答问题时还能展示思维过程。用户只需进入聊天入口,选择“Think”模式,即可开启这一魔法功能。此外,“Big Brain”模式和智能体“深度搜索”(Deep Search)模式也同步上线,为用户带来更多选择。

马斯克在预告中曾豪言Grok-3是“地球上最聪明的AI”,如今看来此言不虚。Grok-3的发布不仅让xAI重回世界第一梯队,更让OpenAI等竞争对手感受到了巨大压力。OpenAI前脚发布的o3-mini刚刚击败R1,后脚就被Grok-3追回,让业界惊叹不已。

Grok-3不仅在数学和推理方面表现出色,还能完成更多现实世界中的任务。例如,在“Think”模式下,Grok-3成功生成了一个完整的3D动画,展示了地球发射、火星着陆及返回地球的太空飞船任务。这一过程中涉及大量数学和物理模型的计算,而Grok-3不仅给出了正确答案,还展示了详细的思维痕迹。

此外,Grok-3还带来了首个智能体——DeepSearch。DeepSearch能够在互联网上进行更深入的搜索,提供详细、合理的答案,并展示搜索和推理的过程。这一功能让用户能够更高效地获取信息,节省大量时间。

对于Grok-3的开源计划,马斯克表示将在几个月后全面开源。目前,Grok-3每天都在更新推理功能,并将在一周内上线所有功能。用户可以通过全新网址http://grok.com或App Store下载使用。对于语音助手版和API的上线时间,马斯克也给出了明确的答复。

Grok-3的成就不仅让业界震惊,更让AI大牛们纷纷点赞。AI大佬Karpathy在体验后表示,Grok-3推理模型领先业界,解决了诸多难题。他认为,Grok-3 + Thinking的表现已经达到了与o1 Pro相当的水平,并略优于DeepSeek-R1和Gemini 2.0 Flash Thinking。

Grok-3的成功背后是xAI团队的不懈努力和巨大投入。他们不仅在数据中心实现了液冷技术,还使用了特斯拉的Megapacks为GPU供能。这一切都是为了确保Grok-3能够拥有足够的算力进行训练。未来,xAI团队将继续优化模型和系统,降低能耗,提高效率,为AI技术的发展贡献更多力量。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值