凌晨,阿里云扔出了一颗大招——QwQ-32B,仅 320 亿参数,却能硬刚 DeepSeek-R1 满血版(6710 亿参数)。
不是“还可以”,是真的能打!
最小 13GB,普通电脑能跑,推理速度 30+ Token/s,能写代码、解数学题、逻辑推理一把抓。更夸张的是——MacBook M4 Pro(48G 内存)本地跑,完全流畅!
有兴趣的可以直接试试看,这款 320 亿参数的小钢炮,推理质量和输出稳定性,居然能跟 DeepSeek-R1 满血版一较高下。
参数量级相差一个数量级,结果却难分伯仲!
📌开源地址:https://huggingface.co/Qwen/QwQ-32B
📌博客:https://qwenlm.github.io/blog/qwq-32b
为什么 QwQ-32B 能挑战 DeepSeek-R1?
在大模型的世界,大家早已习惯了“参数越大&