阿里开源最强编程模型Qwen3-Coder！超越GPT-4.1，登顶开源榜首

原创已于 2025-07-23 15:59:54 修改 · 844 阅读

·

7

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#人工智能 #通义千问 #AI编程 #开源大模型 #算家云 #租算力，到算家云 #Qwen3-Coder

于 2025-07-23 15:56:49 首次发布

话题文章专栏收录该内容

245 篇文章

订阅专栏

刚刚，阿里开源了全新的通义千问 AI 编程大模型 Qwen3-Coder 。一经推出，就成功登顶全球开源模型阵营，甚至超越了 GPT4.1 等闭源模型，直接对标全球最强编程模型 Claude4，尤其是在与 Claude Sonnet 4 的较量中，展现出了强大的优势。

Qwen3-Coder 作为千问系列模型中首个采用混合专家 MoE 架构的代码模型，以480B参数激活 35B 参数，原生支持 256K token 的上下文，并且可扩展至 1M 长度。

在训练数据方面，它在代码占比 70% 的 7.5T 数据上进行预训练，随后在后训练阶段针对编程任务及智能体任务开展强化学习，这使得它在通用能力、代码能力及智能体（Agent）能力上都实现了巨大飞跃。

为了方便开发者更好地运用 Qwen3-Coder，团队还开源了一款命令行工具 Qwen Code，该工具能够充分挖掘 Qwen3-Coder 在代理式编程上的潜力。

总的来说，技术突破集中在三个维度：

长文本处理能力：原生支持256K上下文，通过YaRN技术扩展至1M输入长度，可完整解析大型代码仓库或科研论文；
训练数据革新：基于7.5T token训练数据集（代码占比70%），结合强化学习优化代码执行成功率，显著提升复杂任务解决能力；
工具协同生态：同步开源的Qwen Code命令行工具适配Claude Code等协议，支持多工具链协同工作。

在关键的能力评测中，Qwen3-Coder 在浏览器调用（WebArena）、工具调用（BFCL）等智能体能力评测里，刷新了开源模型纪录，成功超越 GPT4.1 。

而在考察模型自主规划解决编程任务的 SWE-Bench 评测中，Qwen3-Coder 取得了开源最佳效果，达到了可与 Claude4 媲美的程度。Claude Sonnet 4 此前在编程模型领域也有着不错的口碑，但其在面对 Qwen3-Coder 时，还是稍显逊色。

从官方发布的部分示例来看，Qwen3-Coder在多个编程领域表现出较高的完成度。

示例1：用Qwen3-Code模拟烟囱拆除

示例2：生成效果逼真的可视化3D地球

示例3：模拟太阳系行星运转动态图

小编也进行了一次实测：

提示词：用p5js生成小球弹跳物理动画，支持重力参数调整。

实测表现

可以动态调整重力和弹性，还能实时增加或清空小球。

目前，Qwen3-Coder 已在魔搭社区、HuggingFace 等平台开源，全球开发者都能够免费下载使用。并且，它很快将接入阿里的 AI 编程产品通义灵码，API 也已上线阿里云百炼。

此次开源标志着国产编程模型在Agent任务领域达到全球顶尖水平。而随着通义灵码等产品即将集成新模型，编程效率革命已进入实质落地阶段。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。