智谱正式发布:AutoGLM 沉思

最新推荐文章于 2025-09-26 13:14:55 发布

原创最新推荐文章于 2025-09-26 13:14:55 发布 · 483 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能

2025 年 3 月 31 日，智谱在中关村论坛上正式发布了全新智能体产品 “AutoGLM 沉思”。以下是关于该产品的详细介绍：

核心能力：
- 深度思考：能够模拟人类在面对复杂问题时的推理与决策过程。例如，在训练过程中未被教过如何访问巨潮资讯网，但当接收 “帮我收集昨天关于具身智能的相关研报” 指令时，它能自主规划并通过访问该网站来解决问题。
- 感知世界：可以像人一样获取并理解环境信息，比如能像人类一样打开并浏览网页，完成从数据检索、分析到生成报告的全过程。
- 工具使用：能够像人一样调用和操作工具，完成复杂任务，从而在处理复杂任务时表现出色，尤其是在金融、法律、教育等领域，能为用户提供全面且深入的研究成果。
技术演进路径：从 GLM - 4 基座模型出发，经过 GLM - Z1 推理模型、GLM - Z1 - Rumination 沉思模型，最终形成 AutoGLM 模型。在这一过程中，智谱通过不断优化模型结构，提升了智能体的深度思考和实际操作能力。特别是在 GLM - Z1 - Rumination 沉思模型中，引入强化学习技术，使模型能够进行自我批评、反思和深度思考，从而在长程推理和任务执行中表现出色。
相关模型：
- GLM - 4 - Air - 0414：基于最新技术积累重新训练的 320 亿参数基座模型，在预训练阶段加入更多代码类、推理类数据，并在对齐阶段针对智能体能力进行优化，大大加强了模型在工具调用、联网搜索等智能体任务上的能力。
- GLM - Z1 - Air：基于 GLM - 4 - Air - 0414 推出的深度思考模型，在性能表现上可与 DeepSeek - R1（671B，激活 37B）媲美，在 AIME 24/25、LiveCodeBench、GPQA 等基准测试中展现出较强的数理推理能力。
产品发布与开源计划：目前，AutoGLM 沉思已在智谱清言网页端、PC 端和手机 App 上线，免费、不限量开放给全球用户。智谱还将于 4 月 14 日正式开源 AutoGLM 沉思核心链路的模型和技术，以推动行业生态发展。

AutoGLM 沉思的发布，不仅是智谱在 AI 领域的一次重要突破，也为智能体技术的发展提供了新的方向，标志着人工智能 Agent 进入了 “边想边干” 的全新阶段。

AutoGLM 沉思的优势主要体现在以下几个方面：

强大的思考与决策能力：能够模拟人类面对复杂问题时的推理与决策过程，通过强化学习学会自我批评、反思和沉思，突破了实时联网搜索、动态工具调用、深度分析和自我验证，实现真正的长程推理，可回应开放式的复杂问题。例如，在未被教过如何访问巨潮资讯网的情况下，能自主规划并访问该网站来收集特定研报。
出色的环境感知与理解能力：可以像人一样获取并理解环境信息，比如能像人类一样打开并浏览网页，从中检索、分析数据，并生成报告，在处理复杂任务时表现出色，能为金融、法律、教育等领域的用户提供全面且深入的研究成果。
灵活的工具调用与操作能力：能够像人一样调用和操作工具，完成复杂任务。例如，它可以根据用户指令完成网页阅读、购物、点外卖、订酒店、评论和点赞朋友圈等操作。
高效的任务处理与执行能力：依托智谱自主研发的全栈大模型技术，融合了 GLM - 4 的通用能力、GLM - Z1 的反思能力、GLM - Z1 - Rumination 的沉思能力以及 AutoGLM 的自动执行能力1。其背后的推理模型 GLM - Z1 - Air 性能可与 DeepSeek - R1 媲美，在速度提升最高 8 倍的同时，价格仅为 DeepSeek - R1 的 1/30，能快速执行复杂任务。
深度研究与实际操作结合：是首个集深度研究能力和操作能力于一体的智能体，不仅能深入研究，还能真正执行任务，推动 AI Agent 从单纯的思考者进化为能交付结果的智能执行者，可实现从数据收集、模型构建到方案落地的全流程自主化。
开源与生态推动：智谱将于 4 月 14 日正式开源 AutoGLM 沉思核心链路的模型和技术，这有助于推动行业生态发展，让更多开发者和研究人员能够基于其技术进行创新和改进，促进整个 AI 智能体领域的发展。