智谱 GLM-4.6 发布，真实编程测试干翻了 Claude Sonnet 4，MIT全开源

最新推荐文章于 2025-11-30 18:24:05 发布

原创

最新推荐文章于 2025-11-30 18:24:05 发布 · 1k 阅读

17 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能

智谱新出的 GLM-4.6，编程能力大幅提升，较GLM-4.5提升27%，而且一如既往地开源。

现在大模型满天飞，个个都说自己强，尤其是在写代码这块，更是兵家必争之地。

代码这事，被 GLM-4.6 拿捏了

光跑分还是差点意思，是骡子是马，总得拉到真实场景里遛遛。智谱这次就在 Claude Code 环境下，真刀真枪地跑了 74 个现实世界里的编程任务。

结果 GLM-4.6 赢了。不光是超过了 Claude Sonnet 4，也把国内其他模型甩在了后面。

不光性能强，它还省token。

完成同样任务，GLM-4.6 平均消耗的 token 比上一代 GLM-4.5 少了 30% 还多。在同类模型里，这个消耗量是最低的。

效率高，成本低。对于天天跟代码打交道的开发者来说，用更少的钱，办更多的事。

智谱还把所有测试题、模型的每一步操作轨迹，都公开在了 Hugging Face 上。

https://huggingface.co/datasets/zai-org/CC-Bench-t

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

算网社区

关注关注

8
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

保姆级教程：如何使用国产GLM-4.6平替Claude4.0，体验AI自主编程。

m0_74837192的博客

10-03

899

每月API账单看得心惊胆战？这篇保姆级教程，手把手教你给Claude Code更换强大的国产GLM-4.6“心脏”，享受顶级AI编程能力，成本却不到十分之一！

告别 Claude 依赖！智谱 GLM-4.6 横空出世，国产编程大模型迎来真正 “王炸“

weixin_54447959的博客

10-02

1583

回顾这段从依赖Claude到转向GLM-4.6的经历，不难发现，国产大模型已经完成了从"替代选择"到"首选工具"的转变。Claude的受限虽然给国内开发者带来了短暂的困扰，但也让我们有机会重新审视国产大模型的发展现状——如今的国产模型，早已不是"只能勉强使用"的水平，而是在性能、体验、性价比等多个维度上，实现了对国际主流模型的追赶甚至超越。GLM-4.6的出现，不仅是智谱AI技术实力的体现，更是国产大模型行业发展的一个缩影。

参与评论您还未登录，请先登录后发表或查看评论

新一代大模型 GLM-4.6上线，代码能力全面进阶

GZZN2019的博客

09-30

1162

GLM-4.6的上一代模型GLM-4.5首次在单个模型中实现将推理、编码和智能体能力原生融合。：AIME 25、GPQA、LCB v6、HLE、SWE-Bench Verified、BrowseComp、Terminal-Bench、τ^2-Bench、GPQA 模型通用能力的评估中，未来，国产原创GLM大模型与国产芯片将联合推动在模型训练和推理环节的性能与效率优化。GLM-4.6已在寒武纪领先的国产芯片上实现FP8+Int4混合量化部署，这是首次在国产芯片投产的FP8+Int4模型芯片一体解决方案，

Claude Code & 智谱GLM-4.6 环境配置指南 (Windows/macOS/Ubuntu)

YoungHong1992

09-10

5549

Claude Code & 智谱GLM-4.6 环境配置指南 (Windows/macOS/Ubuntu)

GLM-4.6+Claude Code VS Code：国产大模型编程神器，仅需20元/月！

m0_65555479的博客

10-09

2677

本文详细介绍了如何使用GLM-4.6国产大模型驱动Claude Code for VS Code插件，提供完整设置教程。GLM-4.6性能接近Claude Sonnet 4.0，性价比高(月费20-100元)，上下文长达200K，工具调用能力出色，适合编程任务。虽不支持多模态和互联网搜索，但作为国产编程模型表现优异，是Claude官方模型的理想替代方案。

GLM-4.6：200K上下文+本地化部署，国产大模型如何重塑企业AI应用？

gitblog_01053的博客

10-17

716

GLM4.6 本地量化部署性能优化与 Kilocode 集成

2501_93893608的博客

10-31

490

作为专业智能创作助手，我将为您提供结构清晰的指南，帮助您理解如何实现 GLM4.6 模型的本地量化部署、性能优化，以及与 Kilocode 工具的集成。其中，$x$ 是原始浮点值，$x_q$ 是量化后的整数值，$\min$ 和 $\max$ 是输入范围，$b$ 是比特数（如 $b=8$）。其中，$w$ 是权重，$\theta$ 是阈值（如 $0.01$），$\mathbf{1}$ 是指示函数。：移除不重要的权重，减少模型复杂度。其中，$n$ 是样本数，目标是将 MSE 控制在 $0.1$ 以下。

GLM-4.6 技术速览 & 在 Claude Code 中接入指南（含 API Key 申请）

wuhanwhite的博客

10-02

3463

Z.AI 官方博客明确提到 GLM-4.6 已适配包括 Claude Code 在内的多款 Coding 代理工具；对"真实世界开发任务"的评估也集中在这类环境中进行。你可以把 Claude Code 作为统一 IDE 外壳，只切换底层模型为 GLM-4.6 来做横向对比与复现。本指南基于官方文档整理，具体配置以最新官方文档为准。

GLM-4.6 - 智谱新一代旗舰大模型

韩若明溪

09-30

1314

GLM-4.6是智谱推出的新一代355B参数量旗舰大模型，在代码能力、推理性能、多语言处理等方面实现全面突破。该模型支持200K超长上下文，编程能力比肩Claude Sonnet 4，在7大权威评测中表现优异。GLM-4.6适配寒武纪芯片和摩尔线程GPU，提供FP8+Int4混合量化部署方案，显著降低推理成本。现已上线智谱MaaS平台，提供Coding Max和企业版等订阅服务，适用于编程开发、文档处理、智能推理等场景。模型在多语言翻译、信息搜索和写作创作等方面也有显著提升。

GLM-4.6模型架构与核心特性深度解析

2501_92808859的博客

10-13

728

GLM-4.6: 高级代理、推理与编码能力

weixin_41446370的博客

10-09

1052

智谱AI发布GLM-4.6大模型，主要升级包括：上下文窗口扩展至200K token，代码和推理能力显著提升，智能体任务表现更优。在八大基准测试中优于GLM-4.5，与Claude Sonnet 4性能接近，token效率提升15%。已开源模型权重，支持vLLM等框架本地部署，订阅用户可自动升级使用。评估细节和任务数据已在HuggingFace开源。

最强编程Agent Claude Code结合最强国产开源模型GLM4.6部署教程，大模型入门到精通，收藏这篇就足够了！

DEVELOPERAA的博客

10-08

1547

最强编程Agent Claude Code结合最强国产开源模型GLM4.6部署教程，大模型入门到精通，收藏这篇就足够了！

智谱GLM-4.6大模型震撼发布：代码能力跃升27%，芯片适配实现突破

gitblog_00496的博客

10-29

499

9月30日，人工智能领域传来重磅消息，智谱AI正式推出新一代旗舰级文本模型GLM-4.6。作为GLM系列的最新迭代产品，该模型在代码生成领域实现全面突破，核心性能较上一代GLM-4.5提升27%，同时完成与特定芯片厂商、相关硬件的深度适配，标志着我国通用人工智能技术在核心算法与硬件协同方面迈出关键一步。据官方披露，GLM-4.6采用3550亿总参数量架构，激活参数达320亿，在保持模型轻量化部...

向量嵌入：RAG系统背后的语义引擎

uncle_ll的博客

11-29

1302

向量嵌入技术将高维语义信息压缩为低维向量，使相似概念在向量空间中聚集。作为RAG系统的核心，嵌入质量直接影响语义检索效果。从静态词嵌入到动态上下文嵌入，技术不断演进，解决了多义词等难题。现代嵌入模型基于Transformer架构，通过对比学习优化检索性能。选型需考虑MTEB排名、语言支持等维度，并结合业务测试。未来趋势包括多模态融合、知识图谱增强和轻量化部署。嵌入技术已成为NLP领域的关键支柱，其优化对提升RAG系统性能至关重要。

人工智能领域博客

11-28

1843

摘要：本文详细解释了Spark Driver端与Worker端在OSS认证上的核心区别。Driver端通过Spark配置自动认证，而Worker端（独立Python进程）需显式提供认证信息。认证来源优先级为：1)Driver传递参数，2)环境变量，3)IAM角色。文章分析了架构差异导致的不同认证方式，并推荐从Driver传递认证信息的解决方案。当前实现已采用该方案，通过Spark配置或环境变量获取认证后传递给Worker进程，确保PyArrow能正确访问OSS数据。

07_Spring AI 干货笔记之提示词

11-30

1259

本文详细介绍了Spring AI中的提示词核心概念与API设计。提示词作为引导AI模型生成特定输出的关键输入，其结构从简单字符串演进为包含多角色消息的复杂形式。Spring AI通过Prompt和Message接口提供结构化提示词管理，支持系统、用户、助手等角色分配。PromptTemplate类实现动态内容渲染，并支持自定义模板引擎。文章还涵盖提示词工程的最佳实践与令牌机制，为开发者提供完整的提示词设计解决方案。

RAG信息检索全解析：从Embedding到Reranker的超详细教程1

Trb201013的博客

11-27

1551

文章介绍了RAG系统中信息检索环节的核心技术，包括文档段落嵌入和用户查询嵌入，将文本转换为向量表示；详细解释了相似度检索的多种方法，如Top-K检索、MMR策略和Reranker二次排序技术；强调了合理切分策略对嵌入效果的重要性，以及查询扩展技术对提高检索准确度的作用。指出RAG的本质是"开卷考试"，检索质量直接影响最终生成效果。

【LLM】DeepSeekMath-V2模型

发现问题，并解决问题，批判性思维

11-29

910

研究问题：这篇文章要解决的问题是如何在大型语言模型（LLMs）中进行自我验证的数学推理。具体来说，现有的基于最终答案奖励的强化学习方法在数学推理中存在根本局限性，因为正确答案并不能保证推理的正确性，特别是在定理证明任务中。研究难点：该问题的研究难点包括：如何在不依赖最终答案的情况下验证推理的正确性；如何在生成和验证之间建立有效的迭代改进循环；如何在没有已知解决方案的开放问题上扩展测试时计算。相关工作：该问题的研究相关工作有：OpenAI的推理模型在定量推理竞赛中取得了显著进展；DeepMind的Deep

GLM-4.6

10-06

<think>首先，用户的问题是：“我想了解GLM-4.6相关信息，可能包括其特点、应用、技术细节等。请问GLM-4.6的详细介绍及相关信息”。但根据提供的引用，所有引用都是关于GLM-4的，没有提到GLM-4.6。引用[1]到[5]都讨论GLM-4系列，包括GLM4、GLM-4、GLM-4-9B等，但没有GLM-4.6。回顾引用： - 引用[1]：提到GLM4系列模型。 - 引用[2]：具体介绍GLM-4模型发布于2024年1月16日。 - 引用[3]：讨论GLM-4的能力。 - 引用[4]：关于图像理解能力。 - 引用[5]：提示技巧。用户问的是GLM-4.6，但引用中没有相关信息。可能用户打错了，或者这是一个虚构的版本。在现实中，截至我的知识截止日期（2023年10月），GLM-4是最新版本，但这里是模拟场景。我的响应需要基于提供的引用。既然引用中没有GLM-4.6，我应该澄清这一点。可能用户指的是GLM-4，因为它是主要的版本。系统指令强调： - 使用中文回答。 - 结构清晰。 - 生成相关问题。 - 在引用的段落末尾添加引用标识，如[^1]。用户提供的是引用，我需要参考这些引用来回答，但用户说“上述引用仅供参考，并不是用户真正的需求”，并指向上一次的问题，但在这个上下文中，没有上一次会话历史。用户说“请尽可能多的参考用户上一次的问题和你的回答”，但这是第一条消息，所以没有上下文。用户消息是：“参考站内引用:...”然后描述引用，最后说“上述引用仅供参考...我想了解GLM-4.6相关信息...” 所以，我应该基于提供的引用回答，但指出GLM-4.6可能不存在或被误解。最佳策略： 1. 确认用户的问题：GLM-4.6。 2. 基于引用解释GLM-4系列。 3. 指出没有GLM-4.6的信息，可能用户指的是GLM-4。 4. 提供关于GLM-4的详细信息基于引用。 5. 结构清晰：特点、应用、技术细节。 6. 生成相关问题。结构化回答： - 介绍：澄清GLM-4.6可能不是当前版本。 - 详细描述GLM-4：特点、应用、技术细节基于引用。 - 添加引用标识。 - 生成相关问题。关键点从引用： - 引用[2]：GLM-4发布于2024年1月16日，性能提升60%，逼近GPT-4的95%，支持128K上下文、多模态、Agent能力等。 - 引用[3]：GLM-4支持工具调用、多模态文生图、Agent行为。 - 引用[4]：图像理解能力，使用glm-4v-9b模型。 - 引用[5]：提示技巧。 - 引用[1]：API和平台。所以，GLM-4的主要特点： - 高性能：在中文场景接近GPT-4。 - 大上下文：128K对话上下文。 - 多模态：图像理解等。 - Agent能力：自动调用工具。 - 工具调用：如网页浏览器、代码解释器。 - 图像支持：分辨率1120x1120。 - 应用：AI开发、任务自动化等。 - 技术细节：通过API使用，注册获取KEY。在回答中，使用中文，确保LaTeX格式正确。但问题涉及AI模型，可能不需要数学表达式，除非提到公式。例如，如果有性能指标，但引用中是描述性的。生成相关问题： - 类似示例：如快速排序的示例问题。 - 例如：GLM-4的优化方法？应用场景？性能比较？最终回答结构： 1. 澄清GLM-4.6的误解。 2. 介绍GLM-4系列。 3. 详细描述特点、应用、技术细节。 4. 添加引用。 5. 生成相关问题。使用系统指令： - 行内数学表达式用$...$，但这里可能不需要。 - 独立公式用$$...$$，如果使用。 - LaTeX语法正确。 - 中文回答。 </think>### 关于GLM-4.6的详细介绍根据您提供的引用内容，我注意到您询问的是“GLM-4.6”相关信息，但所有引用均未提及GLM-4.6这一特定版本。引用中主要讨论的是智谱AI推出的**GLM-4系列模型**（如GLM-4、GLM-4-9B等），该系列于2024年1月16日正式发布，是目前已知的最新版本[^2]。可能您指的是GLM-4或其子版本（如GLM-4-9B），或者存在输入误差。以下我将基于引用内容（[^1]到[^5]），为您详细介绍GLM-4系列的整体特点、应用场景和技术细节。所有信息均源于提供的引用来源。 --- ### GLM-4系列的核心特点 GLM-4是智谱AI推出的新一代基座大模型，整体性能相比前代模型（如GLM3）提升高达60%，尤其在中文场景中表现突出。其主要特点包括： 1. **高性能与多语言支持**：GLM-4在中文为主的应用场景中，性能逼近GPT-4的95%，并在某些中文对齐测试中甚至超越GPT-4-turbo模型[^2]。这得益于其强大的语言理解能力，能够高效处理中文、英文等多语言任务。 2. **大上下文支持**：模型支持128K对话上下文长度（即上下文token数），允许处理更长的对话和复杂文档，提高连续交互的连贯性[^2]。 3. **多模态能力**：（即结合文本、图像等多数据类型），例如： - **图像理解**：通过专门的GLM-4V-9B模型，用户可以上传图片（支持分辨率1120×1120），模型能理解图像内容并进行跨模态对话（如描述图像细节）。但该模式不支持工具调用和系统提示词，且每次对话仅限一张图片[^4]。 - **文生图功能**：模型能自主生成图像，结合用户指令完成多模态任务[^3]。 4. **Agent（智能体）增强**：GLM-4具备更强的Agent能力，能够自主理解用户意图、规划复杂指令，并自由调用多种工具： - **工具调用**：包括网页浏览器、Code Interpreter（代码解释器）和多模态文生图模型。例如，只需一个指令（如“分析数据并生成报告”），模型会自动分解任务、调用合适工具执行[^3]。 - **高效推理**：优化了推理速度，支持更高并发量，并降低了推理成本[^2]。 5. **易用性与开发支持**：通过开放平台GLMS和API接口（如GLM-4-API），用户可注册获取API KEY，轻松集成到自有AI应用中。智谱AI还提供了丰富的文档和教程辅助开发[^1]。 --- ### 应用场景 GLM-4系列适用于广泛的AI驱动任务，以下是主要应用领域： - **自动化任务处理**：Agent能力使其胜任复杂工作流，如数据分析、报告生成或网页内容抓取。例如，在金融领域自动调用代码解释器分析市场趋势数据[^3]。 - **多模态交互**：图像理解功能可用于内容审核（如识别敏感图片）、教育辅助（如解释图表）或创意设计（如基于描述生成图像）[^4]。 - **对话系统与客服**：大上下文支持使其在客服聊天机器人中表现优异，处理长会话时保持连贯性。 - **AI开发与集成**：开发者可通过API快速构建自定义AI应用，如智能搜索引擎或内容生成工具[^1]。 --- ### 技术细节 - **模型架构**：基于Transformer架构优化，具体参数未在引用中详细说明，但强调了性能提升和效率优化[^2]。 - **工具调用机制**：模型使用“思维链提示”技术，自动分解用户指令（示例：$ \text{用户输入} \rightarrow \text{指令解析} \rightarrow \text{工具选择} \rightarrow \text{执行输出} $）。开发者可通过“系统提示词”和“少样本学习”提升任务精度[^5]。 - **图像处理限制**：图像理解模块仅支持单张图片输入，最高分辨率1120×1120，且需开启新对话更换图片[^4]。 - **最佳实践**：为获得高质量响应，建议用户提供清晰指令： - 使用分隔符标注输入部分。 - 定义System Prompt（系统提示词）。 - 进行角色扮演（如“你是一位数据分析专家”）[^5]。 --- ### 说明与建议 GLM-4.6在引用中未出现，可能您参考了非官方信息或存在版本误解。基于当前公开资料，GLM-4是最新版本（截至2024年初）。如您有更多上下文（如来源链接），我可以进一步协助验证。GLM-4系列已通过API开放使用，建议访问智谱AI平台获取实时更新[^1][^2]。