智谱AI推出GLM-Z1系列模型:推理速度达200 Tokens/s,性价比碾压同类产品

智谱AI推出GLM-Z1系列模型:推理速度达200 Tokens/s,性价比碾压同类产品

【免费下载链接】GLM-4-32B-Base-0414 【免费下载链接】GLM-4-32B-Base-0414 项目地址: https://ai.gitcode.com/hf_mirrors/THUDM/GLM-4-32B-Base-0414

2025年4月15日,北京——人工智能领域再掀技术风暴。智谱AI今日宣布开源新一代推理模型GLM-Z1系列,以200 Tokens/s的推理速度刷新行业纪录,较同类产品提升8倍性能。该系列不仅在数学推理、代码生成等核心任务上实现与大参数量模型的效果持平,更将使用成本压缩至传统方案的1/30,重新定义了AI推理的性价比标准。

性能突破:小参数实现大模型能力

GLM-Z1系列包含三个版本:基础版GLM-Z1-Air、极速版GLM-Z1-AirX和免费体验版GLM-Z1-Flash。其中32B参数量的GLM-Z1-Air在AIME数学竞赛、LiveCodeBench代码生成、GPQA科学问答等权威评测中,性能与671B参数量的DeepSeek-R1基本持平,尤其在工具调用精度和科学推理任务上表现更优。通过创新的"对战排序反馈强化学习"技术,模型在复杂逻辑推理场景中展现出显著优势,官方测试显示其冷启动响应速度提升40%,多轮推理连贯性增强35%。

实测数据显示,在物理浮力问题推理中,GLM-Z1-Air准确得出"冰块融化后水面高度不变,含铁钉时水面下降"的结论;面对五位数密码逻辑题(甲:84261、乙:26048、丙:49280,每人猜对不相邻两位数),模型成功推导出正确密码"24081",而同等测试条件下DeepSeek-R1出现推理偏差。值得注意的是,在"五斤花生榨四两油,十斤花生榨多少油"这类包含单位陷阱的问题中,所有主流模型均未能完全规避认知偏差,反映出当前推理模型在常识性陷阱题上仍有提升空间。

技术创新:深度研究能力开源落地

同步开源的GLM-Z1-Rumination-32B沉思模型,首次将"深度研究"(Deep Research)能力推向开源社区。该模型采用类学术研究的思考范式,通过"自主提问-工具搜索-分析整合-结论生成"的闭环流程处理复杂任务。官方测试显示,其在撰写《北京杭州AI发展对比研究》时,能自动检索最新政策文件、产业数据和国际案例,生成万字级分析报告,耗时约4分30秒,信息准确率达89%,逻辑连贯性评分超越GPT-4o同类输出。

与传统模型追求秒级响应不同,沉思模型允许5-10分钟的思考周期,通过动态调整推理路径应对开放性问题。这种设计使其特别适用于战略规划、文献综述、技术白皮书等深度内容创作场景。值得关注的是,该技术此前被OpenAI、谷歌等公司列为核心机密,智谱此次选择MIT协议完全开源,将加速学术界对复杂推理机制的研究进程。

生态布局:全链路服务降低使用门槛

为降低开发者使用门槛,GLM-Z1系列提供完整的部署方案,支持从本地私有部署到云端API调用的全场景应用。通过智谱AI开放平台调用API时,基础版单价仅为同类产品的1/30,极速版虽定价略高,但综合性能成本比仍保持3倍以上优势。开源社区可通过gitcode仓库获取完整代码(https://gitcode.com/hf_mirrors/THUDM/GLM-4-32B-Base-0414),支持商业应用开发。

同步上线的z.ai域名打造了极简交互入口,用户可直接通过浏览器体验模型能力。配合此次发布的"推理即服务"战略,智谱提出"让每个开发者拥有超级大脑"的愿景,其API定价体系显示:100万tokens调用成本仅相当于传统云服务的1/5,大规模部署场景下成本优势更为显著。

此次开源标志着AI推理技术正式进入"速度与成本双突破"的新阶段。随着32B参数量模型实现600B+级性能,行业正加速从"参数竞赛"转向"效率革命"。GLM-Z1系列通过算法创新而非单纯堆参数量实现的突破,为中小算力场景提供了高性能解决方案,其开源策略也将推动推理技术在教育、科研、中小企业服务等领域的普惠应用。未来,随着沉思模型在专业领域的深度落地,AI或将逐步承担起初级研究助理的角色,重新定义知识工作的生产方式。

【免费下载链接】GLM-4-32B-Base-0414 【免费下载链接】GLM-4-32B-Base-0414 项目地址: https://ai.gitcode.com/hf_mirrors/THUDM/GLM-4-32B-Base-0414

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值