叫板ChatGPT-4，马斯克携xAI发布Grok-2.0，网友玩出花啦

最新推荐文章于 2025-08-28 09:44:52 发布

原创最新推荐文章于 2025-08-28 09:44:52 发布 · 908 阅读

17 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能

人工智能专栏收录该内容

21 篇文章

订阅专栏

部署运行你感兴趣的模型镜像

标题：

网址：x.com/i/premium_sign

近日，xAI公司（由埃隆·马斯克创立）发布了聊天机器人Grok的升级版Grok-2，正处于测试阶段，xAI称其较Grok-1.5有显著进步。同时，还推出了更轻便的Grok-2 mini版本。Grok模型进展速度惊人！

引人注目的是，在由美国加州大学伯克利分校运营的权威大型模型系统（LMSYS，即Large Model Systems）所举办的聊天机器人竞技场竞赛排名中，Grok-2 模型凭借其卓越表现，已经成功跃居前列，超越了包括OpenAI、Anthropic这样的行业先锋，以及谷歌与Meta在内的科技巨头旗下的部分顶尖AI模型。

在LMSYS的排行榜上，代号为“sus-column-r”的Grok-2模型取得了令人瞩目的第三名成绩，它紧随OpenAI的GPT-4o与Gemini-1.5 Pro之后，却稳稳地超越了GPT-4o mini、Claude 3.5、Gemini Advanced以及Llama 3，展现出其强大的竞争力与实力。

Grok2.0实力如何：

Grok2.0在处理复杂任务时表现出色，特别是在研究生级科学知识（GPQA）、数学竞赛问题（MATH）和代码生成（HumanEval）等领域，相较于Grok1.5和Grok mini，其得分显著提高了10%-20%。虽然具体细节未完全公开，但xAI计划在未来发布Grok的多模态理解预览版，这表明Grok2.0在视觉、语言等多模态任务上的处理能力也将有所提升。

相较于前沿模型，Grok-2在编码、数学及通用知识领域内的表现虽然与GPT-4o、Llama 3 405B等顶尖模型存在细微差距，但其结果却异常接近，这一成就已显著超越了GPT-4 Turno、Claude 3 Opus等基准模型的性能。特别是在视觉化任务领域，Grok-2使用了Black Forest Labs的FLUX.1技术进行图像生成，展现出了非凡的实力。值得一提的是，Grok 2.0还成功解决了“9.11大还是9.8大的难题”，这一成就进一步印证了其在复杂视觉与语言处理任务中的卓越能力。

xAI在训练过程中使用了AI导师模型来模拟现实世界中的交互场景，不断优化Grok2.0的响应能力。这使得Grok2.0在利用检索内容进行推理和工具使用方面得到了大幅提升。

xAI公司打算在X平台的多项服务中实施Grok-2及其小型版本Grok-2 Mini，这将涵盖增强搜索功能、帖子的分析处理以及回复生成等方面。预计这种深层次的整合将极大地优化用户在使用平台时的感受。

通过利用X平台的大量实时社交数据进行训练和优化，Grok-2不仅拥有其他AI模型难以复制的优势，这种策略还可能激励更多用户升级至付费账户X Premium或X Premium+。

Grok2.0上线不久，网友就开始整活啦！

马斯克多次公开表示，特斯拉大模型Grok 2.0版本的性能将“好于”ChatGPT-4。他认为，Grok 2.0在多个方面将展现出比GPT-4更强大的能力。除了Grok 2.0之外，xAI还有更长远的规划。马斯克曾表示，他的多个项目（如Neuralink、Optimus以及Grok AI助手）都隐约指向一个终极目标：通用人工智能（AGI）。因此，Grok 2.0的推出只是xAI迈向这一目标的一个重要步骤。

不久，xAI将在X平台及API上发布Grok多模态理解预览版，再次领跑AI开发。Grok-2的推出结合新集群的助力，显著增强了模型推理能力，展现了xAI在技术创新上的不懈追求。