最近o1圈很忙,国内先是DeepSeek-R1-Lite上线,阿里国际开源Marco-o1,没几天,阿里千问系列又开源了QwQ-32B-Preview:专注于增强 AI 推理能力。
具体表现如下:
-
强大的数学问题解决能力,在AIME、MATH-500数学评测上,超过了OpenAI o1-preview
-
优秀的编码能力,LiveCodeBench接近OpenAI o1-preview
-
其他方面还有很大的提升空间,比如科学推理能力GPQA


数学推理case,超长推理过程


https://qwenlm.github.io/zh/blog/qwq-32b-preview/model https://huggingface.co/Qwen/QwQ-32B-Previewdemo https://huggingface.co/spaces/Qwen/QwQ-32B-preview
来源 | PaperAgent
3567

被折叠的 条评论
为什么被折叠?



