LLMDebugger开源项目教程-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00587/article/details/142807881

LLMDebugger开源项目教程

LLMDebugger LDB: A Large Language Model Debugger via Verifying Runtime Execution Step by Step 项目地址: https://gitcode.com/gh_mirrors/ll/LLMDebugger

1. 项目介绍

LLMDebugger是一个用于调试大型语言模型（LLM）生成代码的开源项目。该项目通过逐步验证运行时执行信息，模仿人类开发者的调试过程，从而提高LLM生成代码的准确性和可靠性。LLMDebugger将程序分割成基本块，跟踪每个块运行时的中间变量值，使LLM能够集中关注更简单的代码单元，逐块验证其正确性，并高效定位潜在错误。

2. 项目快速启动

安装环境

首先，创建一个conda环境并安装所需的依赖：

conda create -n ldb python=3.10
conda activate ldb
python -m pip install -r requirements.txt

设置环境变量

如果你使用OpenAI模型作为后端，需要设置OpenAI API密钥：

export OPENAI_API_KEY=[your OpenAI API Key]

如果你使用starcoder或codellama，建议基于vLLM设置一个OpenAI兼容的服务器。具体设置请参考vLLM官方文档。

生成程序种子

进入programming目录，运行以下脚本生成程序种子：

cd /programming
./run_simple.sh [dataset] [model] [output_dir]

结果将保存在output_data/simple/[dataset]/[model]/[output_dir]。

可选参数：

dataset: humaneval, mbpp, transcoder
model: gpt-3.5-turbo-0613, gpt-4-1106-preview, starcoder, codellama (codellama/CodeLlama-34b-Instruct-hf)

调试程序

运行以下脚本进行程序调试：

cd /programming
./run_ldb.sh [dataset] [model] [seed] [output_dir]

结果将保存在output_data/ldb/[dataset]/[model]/[output_dir]。

可选参数：

dataset: humaneval, mbpp, transcoder
model: gpt-3.5-turbo-0613, gpt-4-1106-preview, starcoder, codellama (codellama/CodeLlama-34b-Instruct-hf)
seed: 要调试的种子程序路径，可以在input_data/[dataset]/seed/[model]/seed.jsonl中找到

使用LLMDebugger API

LLMDebugger提供API用于调试和生成代码：

from ldb import PyGenerator

gen = PyGenerator()
messages = gen.ldb_debug(prompt, code, test, entry_point, model, "", dataset_type, "block")
fixed_code, messages = gen.ldb_generate(func_sig=task, model=model, prev_func_impl=code, messages=messages, failed_tests=test, dataset_type=dataset_type)

更多详情请参考项目中的示例代码。