3月11日晚,马斯克在社交平台宣布,将在本周开源生成式AI产品——Grok。
Grok是马斯克旗下公司xAI在去年11月发布的,一款类ChatGPT产品,可以提供生成文本、代码、邮件、信息检索等功能。其测试性能超过GPT-3.5、LLaMA 2 70B,弱于GPT-4。
目前,该产品仅为X Premium+客户提供服务,至今没有大范围对外开放使用非常神秘。

Grok简单介绍
根据xAI在官网公布的早期模型卡显示,首先开发团队先训练了一个330亿参数的原始大模型Grok-0,其性能相当于700亿参数的LLaMA 2,但仅使用其一半的训练资源。
然后基于Grok-0进行蒸馏、微调开发了Grok-1,在GSM8k、MMLU、HumanEval等多个测试平台显示,其性能全面超过了LLaMA 2-70B、GPT-3.5。但与Claude 2、GPT-4还有较大的距离。

由于这些基准测试是公开的,Grok-1的训练数据可能已经包含了测试答案。
随后,开发团队使用了2023年匈牙利全国高中决赛的数学题对Grok-1、Claude 2、GPT-4进行了人工测试。
结果显示,Grok-1 以 C (59%) 的成绩通过了考试,而 Claude-2取得了差不多的成绩 (55%),GPT-4 以 68% 的成绩获得了B,其推理能力还是挺不错的。
<

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



