OpenBayes 教程上新丨Qwen3狂揽近20k star，网友实测：比Llama更快解决更难问题

原创

于 2025-04-30 19:29:50 发布 · 1k 阅读

·

10

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#llama #Qwen #vLLM #语言模型 #人工智能 #深度学习 #推理模型

4 月 29 日凌晨，Qwen3 模型「家族」终于正式亮相，共 8 款混合推理模型全部开源， 仅仅一天的时间便在 GitHub 斩获近 20k stars，而除了极高的讨论热度外，Qwen3 更是凭借性能的提升与部署成本的下探，一举问鼎开源大模型王座。

开源版本包含 2 个 MoE 模型：Qwen3-235B-A22B 和 Qwen3-30B-A3B；6 个 Dense 模型：Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B。

根据官方发布的数据，旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中，表现出与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 相媲美的能力。 值得一提的是，Qwen3-30B-A3B 的激活参数数量仅为 QwQ-32B 的 10%，但表现更胜一筹，甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。

在这里插入图片描述

面对性能表现一举超越 OpenAI-o1 与 DeepSeek-R1 两大顶流的 Qwen3，全球开发者跃跃欲试，不少已经发布了一手实测评价，可谓是「好评如潮」。

在这里插入图片描述

*图源：X 用户 Hasan Toor*

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。