2025 年 3 月 31 日,智谱在中关村论坛上正式发布了全新智能体产品 “AutoGLM 沉思”。以下是关于该产品的详细介绍:
- 核心能力:
- 深度思考:能够模拟人类在面对复杂问题时的推理与决策过程。例如,在训练过程中未被教过如何访问巨潮资讯网,但当接收 “帮我收集昨天关于具身智能的相关研报” 指令时,它能自主规划并通过访问该网站来解决问题。
- 感知世界:可以像人一样获取并理解环境信息,比如能像人类一样打开并浏览网页,完成从数据检索、分析到生成报告的全过程。
- 工具使用:能够像人一样调用和操作工具,完成复杂任务,从而在处理复杂任务时表现出色,尤其是在金融、法律、教育等领域,能为用户提供全面且深入的研究成果。
- 技术演进路径:从 GLM - 4 基座模型出发,经过 GLM - Z1 推理模型、GLM - Z1 - Rumination 沉思模型,最终形成 AutoGLM 模型。在这一过程中,智谱通过不断优化模型结构,提升了智能体的深度思考和实际操作能力。特别是在 GLM - Z1 - Rumination 沉思模型中,引入强化学习技术,使模型能够进行自我批评、反思和深度思考,从而在长程推理和任务执行中表现出色。
- 相关模型:
- GLM - 4 - Air - 0414:基于最新技术积累重新训练的 320 亿参数基座模型,在预训练阶段加入更多代码类、推理类数据,并在对齐阶段针对智能体能力进行优化,大大加强了模型在工具调用、联网搜索等智能体任务上的能力。
- GLM - Z1 - Air:基于 GLM - 4 - Air - 0414 推出的深度思考模型,在性能表现上可与 DeepSeek - R1(671B,激活 37B)媲美,在 AIME 24/25、LiveCodeBench、GPQA 等基准测试中展现出较强的数理推理能力。
- 产品发布与开源计划:目前,AutoGLM 沉思已在智谱清言网页端、PC 端和手机 App 上线,免费、不限量开放给全球用户。智谱还将于 4 月 14 日正式开源 AutoGLM 沉思核心链路的模型和技术,以推动行业生态发展。
AutoGLM 沉思的发布,不仅是智谱在 AI 领域的一次重要突破,也为智能体技术的发展提供了新的方向,标志着人工智能 Agent 进入了 “边想边干” 的全新阶段。
AutoGLM 沉思的优势主要体现在以下几个方面:
- 强大的思考与决策能力:能够模拟人类面对复杂问题时的推理与决策过程,通过强化学习学会自我批评、反思和沉思,突破了实时联网搜索、动态工具调用、深度分析和自我验证,实现真正的长程推理,可回应开放式的复杂问题。例如,在未被教过如何访问巨潮资讯网的情况下,能自主规划并访问该网站来收集特定研报。
- 出色的环境感知与理解能力:可以像人一样获取并理解环境信息,比如能像人类一样打开并浏览网页,从中检索、分析数据,并生成报告,在处理复杂任务时表现出色,能为金融、法律、教育等领域的用户提供全面且深入的研究成果。
- 灵活的工具调用与操作能力:能够像人一样调用和操作工具,完成复杂任务。例如,它可以根据用户指令完成网页阅读、购物、点外卖、订酒店、评论和点赞朋友圈等操作。
- 高效的任务处理与执行能力:依托智谱自主研发的全栈大模型技术,融合了 GLM - 4 的通用能力、GLM - Z1 的反思能力、GLM - Z1 - Rumination 的沉思能力以及 AutoGLM 的自动执行能力1。其背后的推理模型 GLM - Z1 - Air 性能可与 DeepSeek - R1 媲美,在速度提升最高 8 倍的同时,价格仅为 DeepSeek - R1 的 1/30,能快速执行复杂任务。
- 深度研究与实际操作结合:是首个集深度研究能力和操作能力于一体的智能体,不仅能深入研究,还能真正执行任务,推动 AI Agent 从单纯的思考者进化为能交付结果的智能执行者,可实现从数据收集、模型构建到方案落地的全流程自主化。
- 开源与生态推动:智谱将于 4 月 14 日正式开源 AutoGLM 沉思核心链路的模型和技术,这有助于推动行业生态发展,让更多开发者和研究人员能够基于其技术进行创新和改进,促进整个 AI 智能体领域的发展。
361

被折叠的 条评论
为什么被折叠?



