DeepSeek团队新作：把代码变成思维链，大模型推理各种能力全面提升

最新推荐文章于 2025-12-02 15:55:42 发布

原创最新推荐文章于 2025-12-02 15:55:42 发布 · 963 阅读

16 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #langchain #transformer #知识图谱 #大数据

用代码训练大模型思考，其他方面的推理能力也能提升。

DeepSeek团队最新研究，利用300多万个实例，将代码转换成思考过程，构建出数据集CODEI/O，对Qwen、Llama等模型进行了训练。

结果，在各种类型的推理任务当中，模型性能都取得了全面提升，包括在非代码类的推理任务上，也展现出了良好的迁移能力。

研究团队认为，在代码当中暗含了不同类型场景的思考过程，于是想要把这种思考过程“提取”出来训练推理模型。

他们生成了大量的训练数据运行这些代码，然后把代码、输入/输出对以及功能描述输入DeepSeek-V2.5，从而合成自然语言形式的推理过程。

在此基础上，团队还引入了验证和修订机制，形成了更高质量的CODEI/O++。

从代码中构建思维链

首先，作者从CodeMix、PyEdu-R等数据集中收集了80多万份代码文件，涵盖多种编程语言（以Python为主），任务类型多样，并且蕴含了丰富的推理模式。

但是，由于原始代码文件通常缺乏结构化，包含不相关的元素，难以以自包含的方式执行，作者使用DeepSeek-V2.5模型对其进行预处理，将其转换为统一的格式。

转换过程中的工作主要包括把核心逻辑功能提取到函数中，添加总结整体逻辑的主入口函数，明确定义主入口函数的输入/输出，创建独立的基于规则的输入生成器函数，以及基于主入口函数生成简明的问题陈述作为查询等等。

接下来，在转换后的每个函数上，使用输入生成器采样多个输入，并通过执行代码获得相应的输出，从而收集输入-输出对。

这一过程中，部分代码出现了超时、复杂度过高、不可执行或结果不确定等情况，这部分代码被作者跳过，最终生下了40多万份代码文档，产生了350万个样本实例。

然后，作者利用DeepSeek-V2.5，将代码、输入输出对、功能描述等信息合成为自然语言思维链（CoT），构建训练样本。

对于每一个输入-输出对，作者首先构建一个输入提示。这个提示由几个部分拼装而成：

函数定义：即之前结构化和标准化后的Python函数代码。
文本描述：用自然语言概括函数的功能和目的。
参考代码：与函数定义类似，但可能包含一些额外的上下文信息或注释。
输入或输出：根据是输入预测还是输出预测任务，提示中会包含具体的输入或期望的输出。

将构建好的提示输入给DeepSeek-V2.5模型，模型会根据提示生成一段自然语言文本作为响应。

这段文本就是作者想要的推理过程——它需要解释如何从给定的输入推导出输出，或者在给定输出的情况下如何构造出满足条件的输入。

通过这种方式收集的数据集，就是CODEI/O。

在CODEI/O的基础上，作者进一步利用了代码的可执行特性，合成了数据质量更高的CODEI/O++。

作者首先对CODEI/O中生成的所有响应通过重新执行代码进行正确性验证。对于验证为不正确的响应，作者将执行反馈追加为第二轮输入信息，并要求模型重新生成一个响应。

执行反馈包括输出预测的正误、输入预测基于错误输入的执行输出，以及代码执行失败的错误信息等。

在第二轮生成后，再次检查新响应的正确性。

无论第二轮结果如何，最终的响应都由四个部分按顺序构成：第一轮响应、第一轮反馈、第二轮响应和第二轮反馈。

对于第一轮就正确的响应，第一轮反馈简单标记为“Success”，且没有第二轮内容。

与CODEI/O一样，所有修订后的响应都会被保留。通过引入基于执行反馈的多轮修正所构建的增强型数据集就是CODEI/O++。

数据集构建完成后，作者采用了两阶段训练策略对相关模型进行训练。

第一阶段先用CODEI/O或CODEI/O++来训练推理能力，然后再用通用指令数据集进行微调，教会模型遵循自然语言指令、执行各种任务。

模型推理能力全面提升

为了评估CODEI/O或CODEI/O++的效果，作者一共找来了四个模型来进行测试，分别是Qwen 2.5-7B-Coder、Deepseek v2-Lite-Coder、Llama 3.1-8B和Gemma 2-27B。

测试过程中，作者共选用了10余个数据集，测试了模型常识、数学、代码、物理、工程等领域的表现，具体数据集如下表：

CODEI/O训练之后，Qwen-Coder在代码理解任务上取得了突破性进展，并且在阅读理解和推理任务（如DROP）上也有明显提升，这表明通过代码训练获得的推理能力确实迁移到了其他领域。

DeepSeek-Coder在CODEI/O的训练下也展现出了均衡的进步，在各个维度上都实现了稳定的改进。

Qwen-Coder和DeepSeek-Coder的表现说明，即使是已经在代码领域有专门训练的模型，也能从这种结构化的推理训练中获益。

Llama在LeetCode-O上的性能提升了将近150%，说明即使是参数量较小的模型，通过合适的训练方法也能在特定任务上获得较大提升。

而Gemma作为测试中最大的模型，展示了CODEI/O方法在大规模模型上的适用性，在多个关键领域取得了进步。

相比于数据量更大的WebInstruct（WI），CODEI/O整体上取得了更好的效果；而相对于专门为某种任务设计的OpenMathInstruct2（OMI2）、PyEdu等方式，CODEI/O体现了更强的通用性。

如何学习AI大模型？

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。【保证100%免费】🆓

优快云粉丝独家福利

这份完整版的 AI 大模型学习资料已经上传优快云，朋友们如果需要可以扫描下方二维码&点击下方优快云官方认证链接免费领取 【保证100%免费】

读者福利： 👉👉优快云大礼包：《最新AI大模型学习资源包》免费分享 👈👈

（👆👆👆安全链接，放心点击）

对于0基础小白入门：

如果你是零基础小白，想快速入门大模型是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

👉1.大模型入门学习思维导图👈

要学习一门新的技术，作为新手一定要先学习成长路线图，方向不对，努力白费。

对于从来没有接触过AI大模型的同学，我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线，大家跟着这个大的方向学习准没问题。（全套教程文末领取哈）
在这里插入图片描述

👉2.AGI大模型配套视频👈

很多朋友都不喜欢晦涩的文字，我也为大家准备了视频教程，每个章节都是当前板块的精华浓缩。

在这里插入图片描述

👉3.大模型实际应用报告合集👈

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。（全套教程文末领取哈）

在这里插入图片描述

👉4.大模型落地应用案例PPT👈

光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。（全套教程文末领取哈）

在这里插入图片描述

👉5.大模型经典学习电子书👈

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。（全套教程文末领取哈）

在这里插入图片描述

👉6.大模型面试题&答案👈

截至目前大模型已经超过200个，在大模型纵横的时代，不仅大模型技术越来越卷，就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道，我总结了大模型常考的面试题。（全套教程文末领取哈）

在这里插入图片描述
👉学会后的收获：👈
• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求：大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能，学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力：大模型应用开发需要掌握机器学习算法、深度学习

优快云粉丝独家福利

这份完整版的 AI 大模型学习资料已经上传优快云，朋友们如果需要可以扫描下方二维码&点击下方优快云官方认证链接免费领取 【保证100%免费】

读者福利： 👉👉优快云大礼包：《最新AI大模型学习资源包》免费分享 👈👈

（👆👆👆安全链接，放心点击）

DeepSeek团队新作：把代码变成思维链，大模型推理各种能力全面提升

从代码中构建思维链

模型推理能力全面提升

如何学习AI大模型 ？

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

优快云粉丝独家福利

👉1.大模型入门学习思维导图👈

👉2.AGI大模型配套视频👈

👉3.大模型实际应用报告合集👈

👉4.大模型落地应用案例PPT👈

👉5.大模型经典学习电子书👈

👉6.大模型面试题&答案👈

优快云粉丝独家福利

如何学习AI大模型？