DSPy 框架介绍：编程式 Prompt 优化如何提升准确率？-优快云博客

DSPy 是斯坦福提出的一种编程范式和开源框架，其核心目标是将 Prompt 设计流程标准化、模块化和优化算法化。本文将从开发者角度介绍 DSPy 的模块结构、提示编译范式以及它如何提升大模型应用的准确性与可控性。

一、为什么需要 DSPy？Prompt 不应该是“写死”的

在以往的大模型开发中，Prompt 工程是一项充满经验主义的工作：

靠试错反复调整提示模板
模型性能强烈依赖提示词微调
很难系统性优化或重用已有设计

而 DSPy（Declarative Self-improving Python）提出了一个更科学的方向：

将 Prompt 设计与优化转变为显式的、可组合的程序构件。

这就像 PyTorch 将神经网络结构变成可训练对象一样，DSPy 将 Prompt 变成“编译单元”，支持训练、评估、组合与推理。

二、DSPy 是什么？一句话解释：Prompt = 可编程构件

DSPy 是一个框架，也是一种范式：它让你用 Python 编写大模型的提示模块，并用训练数据对这些模块进行编译优化。

核心思路：

每个任务都由一个 Module（DSPy 模块）表示
每个模块内部包含 Prompt、输入输出接口、优化空间
可以使用校验器（Checkers）定义准确性目标
可使用编译器（Compiler）对 Prompt 进行优化生成

三、DSPy 的模块结构一览

DSPy 项目中的核心构件包括：

1. `Signature`

声明模块输入/输出结构，等价于函数签名。

from dsp import Signature
sig = Signature("question -> answer")

2. `Module`

定义一个功能模块，可包含多个 Prompt 实现。

from dsp.modules import Generative

class MyQA(Generative):
    def __init__(self):
        super().__init__(signature="question -> answer")

3. `Compiler`

优化器，用于根据训练集/评估指标自动生成最佳 Prompt。

常用编译器：

BootstrapFewShot
TrainableCompiler
ReActCompiler（强化学习式）

from dsp import BootstrapFewShot
compiler = BootstrapFewShot()  # 使用少样本构造 prompt
compiled = compiler.compile(MyQA(), trainset=data, valset=val_data)

4. `Check`

任务评估函数，用于自动检验 LLM 输出是否满足准确率。

from dsp.checks import AnswerExactMatch
check = AnswerExactMatch()

模块完整工作流：定义任务 → 声明接口 → 编写 Prompt → 编译器搜索 → 生成优化提示 → 应用推理

四、Prompt 编译：从经验艺术到可控系统

DSPy 将 Prompt 视为“可以训练”的模块，它内部实现了一套 Prompt 编译器系统：

编译器如何优化 Prompt？

从候选 Prompt 模板中生成变体
用 LLM 执行这些变体，在训练数据上测试输出质量
使用 Checker 验证输出是否符合目标（如准确率 ≥ 80%）
选择最优变体作为部署 Prompt

举例：你写了一个文本分类模块 TextClassifier，只需：

compiled = compiler.compile(TextClassifier(), trainset, valset)

即会自动在候选提示中选择最佳版本。

这极大减少了开发者对 Prompt 微调的依赖，也使优化流程可重复。

五、一个实际例子：使用 DSPy 构建问答模块

from dsp.modules import Generative
from dsp import Signature

class MyQA(Generative):
    def __init__(self):
        super().__init__(signature="question -> answer")

    def forward(self, question):
        return self.llm(f"请简洁地回答：{question}")

qa = MyQA()
print(qa("法国的首都是哪里？"))

加上编译优化：

compiler = BootstrapFewShot()
compiled = compiler.compile(MyQA(), trainset, valset)
print(compiled("法国的首都是哪里？"))

六、DSPy 与 LangChain、LlamaIndex 的区别

项目	核心定位	编程抽象	关注重点
LangChain	应用编排框架	Chain/Agent	多模块组合能力
LlamaIndex	数据增强中间层	Index/QueryEngine	外部数据接入
DSPy	Prompt 优化框架	Module/Compiler	提示词编译与可控性