DeepSeek-LLM版本对比：Base模型与Chat模型核心差异解析-优快云博客

DeepSeek-LLM版本对比：Base模型与Chat模型核心差异解析

还在为选择哪个DeepSeek-LLM版本而困惑？一文帮你彻底搞懂Base模型与Chat模型的本质区别！

通过本文，你将获得：

Base模型（如DeepSeek-LLM-67B-Base](https://link.gitcode.com/i/475a941ebc39fb430e21498eb8153b9f)

模型类型	GSM8K	MATH	中文数学
Base模型	63.4%	-	-
Chat模型	84.1%	32.6%	74.0%

Chat模型在数学推理方面表现显著优于Base模型，特别是在GSM8K数据集上达到84.1%的准确率。

模型类型	HumanEval	MBPP	LeetCode竞赛
Base模型	42.7%	57.4%	-
Chat模型	73.8%	61.4%	17.5%

Chat模型在编程任务上表现更加出色，HumanEval通过率达到73.8%。

模型类型	CEval	CMMLU	中文问答
Base模型	66.1%	70.8%	87.6%
Chat模型	65.2%	67.8%	85.1%

Base模型在中文知识性任务上略占优势，而Chat模型更擅长对话交互。

两种模型共享相同的Transformer架构，但Chat模型经过了额外的指令微调和安全对齐处理：

根据评估数据，Chat模型在：

但Base模型在：

选择最适合你的版本，让DeepSeek-LLM为你的项目赋能！ 🚀

提示：更多详细评估结果请查看evaluation目录中的详细数据报告。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考