标题:
网址:x.com/i/premium_sign
近日,xAI公司(由埃隆·马斯克创立)发布了聊天机器人Grok的升级版Grok-2,正处于测试阶段,xAI称其较Grok-1.5有显著进步。同时,还推出了更轻便的Grok-2 mini版本。Grok模型进展速度惊人!

引人注目的是,在由美国加州大学伯克利分校运营的权威大型模型系统(LMSYS,即Large Model Systems)所举办的聊天机器人竞技场竞赛排名中,Grok-2 模型凭借其卓越表现,已经成功跃居前列,超越了包括OpenAI、Anthropic这样的行业先锋,以及谷歌与Meta在内的科技巨头旗下的部分顶尖AI模型。
在LMSYS的排行榜上,代号为“sus-column-r”的Grok-2模型取得了令人瞩目的第三名成绩,它紧随OpenAI的GPT-4o与Gemini-1.5 Pro之后,却稳稳地超越了GPT-4o mini、Claude 3.5、Gemini Advanced以及Llama 3,展现出其强大的竞争力与实力。

Grok2.0实力如何:
Grok2.0在处理复杂任务时表现出色,特别是在研究生级科学知识(GPQA)、数学竞赛问题(MATH)和代码生成(HumanEval)等领域,相较于Grok1.5和Grok mini,其得分显著提高了10%-20%。虽然具体细节未完全公开,但xAI计划在未来发布Grok的多模态理解预览版,这表明Grok2.0在视觉、语言等多模态任务上的处理能力也将有所提升。

相较于前沿模型,Grok-2在编码、数学及通用知识领域内的表现虽然与GPT-4o、Llama 3 405B等顶尖模型存在细微差距,但其结果却异常接近,这一成就已显著超越了GPT-4 Turno、Claude 3 Opus等基准模型的性能。特别是在视觉化任务领域,Grok-2使用了Black Forest Labs的FLUX.1技术进行图像生成,展现出了非凡的实力。值得一提的是,Grok 2.0还成功解决了“9.11大还是9.8大的难题”,这一成就进一步印证了其在复杂视觉与语言处理任务中的卓越能力。

xAI在训练过程中使用了AI导师模型来模拟现实世界中的交互场景,不断优化Grok2.0的响应能力。这使得Grok2.0在利用检索内容进行推理和工具使用方面得到了大幅提升。
xAI公司打算在X平台的多项服务中实施Grok-2及其小型版本Grok-2 Mini,这将涵盖增强搜索功能、帖子的分析处理以及回复生成等方面。预计这种深层次的整合将极大地优化用户在使用平台时的感受。
通过利用X平台的大量实时社交数据进行训练和优化,Grok-2不仅拥有其他AI模型难以复制的优势,这种策略还可能激励更多用户升级至付费账户X Premium或X Premium+。

Grok2.0上线不久,网友就开始整活啦!




马斯克多次公开表示,特斯拉大模型Grok 2.0版本的性能将“好于”ChatGPT-4。他认为,Grok 2.0在多个方面将展现出比GPT-4更强大的能力。除了Grok 2.0之外,xAI还有更长远的规划。马斯克曾表示,他的多个项目(如Neuralink、Optimus以及Grok AI助手)都隐约指向一个终极目标:通用人工智能(AGI)。因此,Grok 2.0的推出只是xAI迈向这一目标的一个重要步骤。
不久,xAI将在X平台及API上发布Grok多模态理解预览版,再次领跑AI开发。Grok-2的推出结合新集群的助力,显著增强了模型推理能力,展现了xAI在技术创新上的不懈追求。

9万+

被折叠的 条评论
为什么被折叠?



