叫板ChatGPT-4,马斯克携xAI发布Grok-2.0,网友玩出花啦

部署运行你感兴趣的模型镜像

标题:

网址:x.com/i/premium_sign

近日,xAI公司(由埃隆·马斯克创立)发布了聊天机器人Grok的升级版Grok-2,正处于测试阶段,xAI称其较Grok-1.5有显著进步。同时,还推出了更轻便的Grok-2 mini版本。Grok模型进展速度惊人!

5de85893312d53cea16ad81121134f28.jpeg

引人注目的是,在由美国加州大学伯克利分校运营的权威大型模型系统(LMSYS,即Large Model Systems)所举办的聊天机器人竞技场竞赛排名中,Grok-2 模型凭借其卓越表现,已经成功跃居前列,超越了包括OpenAI、Anthropic这样的行业先锋,以及谷歌与Meta在内的科技巨头旗下的部分顶尖AI模型。

在LMSYS的排行榜上,代号为“sus-column-r”的Grok-2模型取得了令人瞩目的第三名成绩,它紧随OpenAI的GPT-4o与Gemini-1.5 Pro之后,却稳稳地超越了GPT-4o mini、Claude 3.5、Gemini Advanced以及Llama 3,展现出其强大的竞争力与实力。

f4d0f834f16e7110ca7f65925fa7aa4f.jpeg

Grok2.0实力如何:

Grok2.0在处理复杂任务时表现出色,特别是在研究生级科学知识(GPQA)、数学竞赛问题(MATH)和代码生成(HumanEval)等领域,相较于Grok1.5和Grok mini,其得分显著提高了10%-20%。虽然具体细节未完全公开,但xAI计划在未来发布Grok的多模态理解预览版,这表明Grok2.0在视觉、语言等多模态任务上的处理能力也将有所提升。

1563302af0232b28b0b7f3ca29ef9173.jpeg

相较于前沿模型,Grok-2在编码、数学及通用知识领域内的表现虽然与GPT-4o、Llama 3 405B等顶尖模型存在细微差距,但其结果却异常接近,这一成就已显著超越了GPT-4 Turno、Claude 3 Opus等基准模型的性能。特别是在视觉化任务领域,Grok-2使用了Black Forest Labs的FLUX.1技术进行图像生成,展现出了非凡的实力。值得一提的是,Grok 2.0还成功解决了“9.11大还是9.8大的难题”,这一成就进一步印证了其在复杂视觉与语言处理任务中的卓越能力。

b6407fd8fdb6f08dbc73aae5cc45fb24.jpeg

xAI在训练过程中使用了AI导师模型来模拟现实世界中的交互场景,不断优化Grok2.0的响应能力。这使得Grok2.0在利用检索内容进行推理和工具使用方面得到了大幅提升。

xAI公司打算在X平台的多项服务中实施Grok-2及其小型版本Grok-2 Mini,这将涵盖增强搜索功能、帖子的分析处理以及回复生成等方面。预计这种深层次的整合将极大地优化用户在使用平台时的感受。

通过利用X平台的大量实时社交数据进行训练和优化,Grok-2不仅拥有其他AI模型难以复制的优势,这种策略还可能激励更多用户升级至付费账户X Premium或X Premium+。

be11254982a51057200f85add0a640c3.jpeg

Grok2.0上线不久,网友就开始整活啦!

5b1640628da658c02773ac333fcc00bb.jpeg61d68739f82218f1206ddb79ba11c6ba.jpeg7aa3dad4ac8b77ea005cc334094609a2.jpega565407dff068efc00163b709b9b22b0.jpeg

马斯克多次公开表示,特斯拉大模型Grok 2.0版本的性能将“好于”ChatGPT-4。他认为,Grok 2.0在多个方面将展现出比GPT-4更强大的能力。除了Grok 2.0之外,xAI还有更长远的规划。马斯克曾表示,他的多个项目(如Neuralink、Optimus以及Grok AI助手)都隐约指向一个终极目标:通用人工智能(AGI)。因此,Grok 2.0的推出只是xAI迈向这一目标的一个重要步骤。

不久,xAI将在X平台及API上发布Grok多模态理解预览版,再次领跑AI开发。Grok-2的推出结合新集群的助力,显著增强了模型推理能力,展现了xAI在技术创新上的不懈追求。

f09d5c6eec0624c62446f6a9f84216b5.jpeg

您可能感兴趣的与本文相关的镜像

GPT-oss:20b

GPT-oss:20b

图文对话
Gpt-oss

GPT OSS 是OpenAI 推出的重量级开放模型,面向强推理、智能体任务以及多样化开发场景

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值