DeepSeek总结常用的CoT方法（ToT、GoT）

原创已于 2025-04-02 05:29:34 修改 · 853 阅读

CC 4.0 BY-SA版权

文章标签：

于 2025-04-02 05:11:26 首次发布

常用的COT

常用的CoT（Chain-of-Thought，思维链）方法通过引导大语言模型生成中间推理步骤，显著提升了复杂任务的解决能力。以下是几种核心方法及其特点：

Few-shot CoT
- 原理：通过人工标注的示例（包含问题、推理步骤和答案）引导模型模仿分步推理。例如，在数学题中提供分步解题的样例，模型通过类比生成类似推理链。
- 特点：依赖高质量人工标注，适用于需明确逻辑引导的任务（如数学推理、代码生成）。
Zero-shot CoT
- 原理：无需示例，仅通过指令（如“请逐步思考”）触发模型的推理能力，例如在问题末尾添加“Let’s think step by step”。
- 特点：灵活性高，适用于缺乏标注数据的场景，但对模型自身推理能力要求较高。

自动思维链（Auto-CoT）
- 原理：利用大模型自动生成示例，替代人工标注。例如，通过模板生成候选指令，再通过评分函数筛选最优提示词。
- 优势：降低人工成本，生成更贴合任务需求的推理链。
Least-to-Most Prompting（分步引导）
- 原理：将复杂问题分解为子问题序列，依次解决。例如，先规划解题步骤，再逐步执行并验证。
- 应用：适合多步骤推理任务（如逻辑谜题、程序生成），通过子问题拆分降低单步复杂度。
Self-consistency CoT（自洽性验证）
- 原理：生成多条推理路径，通过投票或一致性检查选择最优答案。例如，多次采样不同推理过程，综合结果以提升准确性。
- 优势：减少单次推理的随机性，增强答案可靠性。

外部工具辅助型CoT
- 原理：结合知识检索、计算器等工具验证中间步骤。例如，在常识推理中调用外部数据库补全信息。
- 应用场景：解决模型知识局限问题（如实时数据查询、复杂计算）。
多智能体协作CoT
- 原理：多个Agent分工协作，分别负责规划、验证等环节。例如，一个Agent生成代码，另一个检查逻辑漏洞。
- 优势：通过分工提升复杂任务（如系统设计）的完成度。

如需进一步了解某类方法的技术细节或应用案例，可参考相关研究论文（如网页的里程碑论文综述）或实践指南（如网页的实战解析）。

大语言模型（LLM）的推理能力优化方法中，CoT（思维链）、ToT（思维树）、GoT（思维图）是三种典型策略，其核心差异体现在推理结构、灵活性和适用场景上。以下是三者的对比分析：

核心结构：单一线性的推理链条，模型通过逐步推导中间步骤得出最终答案（类似“直道行驶”）。
特点：
- 优势：通过显式引导中间推理步骤，显著提升模型在数学计算、逻辑推理等任务中的表现。
- 局限：
  - 容错性差：若某一步骤出错，后续推理将“一错到底”，无法回溯。
  - 缺乏多路径探索：仅能沿单一方向推进，无法生成或评估多种解决方案。
典型应用：简单推理任务（如数学题解答、文本摘要）。

维度	CoT	ToT	GoT
结构	线性链条	树状分支	网状图结构
灵活性	低（单向）	中（多路径但独立）	高（动态交互）
容错性	低（无回溯）	中（可回溯父节点）	高（任意节点修正）
适用场景	简单推理任务	需多方案探索的任务	跨领域复杂系统问题
实现复杂度	低（仅需提示工程）	中（需设计评分机制）	高（需图算法支持）