智谱发布 GLM-Zero,中国版 “O1” 强势登场,考研数学题轻松破解

本以为到了年末,AI领域的惊喜已经全盘托出。

没想到,在2024年的最后一天,智谱版AI还有惊喜12月31日,智谱 GLM 模型家族迎来了一位新成员——GLM-Zero 的初代版本 GLM-Zero-Preview,这是智谱首个基于扩展强化学习技术训练的推理模型。

【图片来源于网络,侵删】


从年初到年末,在接连推出新一代基座大模型、多模态模型、视频生成模型以及语音模型之后,智谱补上了推理模型这块拼图。

目前,GLM-Zero-Preview 已经上线使用。用户可以在智谱清言网页端选择「Zero 推理模型」智能体,上传文字或图片就能免费体验。另外,GLM-Zero-Preview 的 API 也在智谱开放平台同步上线以供开发者调用。

【图片来源于网络,侵删】

GLM-Zero-Preview ——国产版o1,破解考研数学题的推理学霸!


据介绍,GLM-Zero-Preview 是 GLM 家族中专注于增强 AI 推理能力的模型,擅长处理数理逻辑、代码和需要深度推理的复杂问题。同基座模型相比,GLM-Zero-Preview 既没有显著降低通用任务能力,又大幅提升了专家任务能力。


以考研数学题为例,让 GLM-Zero-Preview 做了一整套 2025 年考研数学一,最后得分为 126,达到了优秀研究生水平。

【图片来源于网络,侵删】

在 AIME 2024、MATH500 和 LiveCodeBench 等评测中,GLM-Zero-Preview 的表现与 OpenAI o1-preview 模型相当。

【图片来源于网络,侵删】

虽然GLM-Zero-Preview 与 OpenAI 的 o3 模型仍有差距,但作为国产推理模型中的优秀模型,小编相信智谱AI后续推出的正式版 GLM-Zero,会将深度思考的能力从数理逻辑扩展到更多更通用的技术。

回看2024年,智谱的技术密集且紧凑:基座模型、多模态模型、视频生成模型、语音模型、推理模型以及智能体方面火出圈的 AutoGLM、GLM-PC,都在壮大智谱的GLM家族。可以说,智谱给今年画上了较为圆满的句号。


不久前,OpenAI 发布了更强的 o3 系列模型。但智谱在年末最后一天这个时间节点推出的 GLM-Zero,让小编相信未来会有更多国内外的公司在通往AGI的道路上不断推出令人惊艳的作品。2025 年,模型推理能力无疑是被寄予厚望的一年。让我们先期待一波吧~

关于这个话题,大家有什么别的看法吗?欢迎在评论区讨论~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值