基于同样的基座:qwen2.5-32b-base,qwen官方先后推出了常规模型qwen2.5-32b-instruct(下面简称instruct模型)和推理模型qwq-32b-preview/qwq-32b(下面简称qwq)。众所周知,推理模型擅长推理,我们可以预期qwq在逻辑推理、数学、代码等方面远胜instruct模型,那其他维度呢?
我们接下来通过全方位的评测一探究竟。评测包括8大领域,300多个细分维度。
| qwen2.5-32b-instruct |
qwq-32b |
变化 |
|
| 总分 |
68.51 |
77.18 |
13% |
| 医疗 |
71.60 |
76.45 |
7% |
| 教育 |
80.02 |
85.90 |
7% |
| 金融 |
71.83 |
78.33 |
9% |
| 法律 |
50.70 |
60.80 |
20% |
| 行政公务 |

最低0.47元/天 解锁文章
7409

被折叠的 条评论
为什么被折叠?



