LMQL项目入门指南：从零开始编写你的第一个提示查询程序-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00654/article/details/148551667

LMQL项目入门指南：从零开始编写你的第一个提示查询程序

lmql A language for constraint-guided and efficient LLM programming. 项目地址: https://gitcode.com/gh_mirrors/lm/lmql

前言

LMQL是一种创新的编程语言，专门设计用于与大型语言模型(LLM)交互。它结合了传统编程语言的逻辑控制能力和自然语言处理的灵活性，为开发者提供了一种全新的方式与AI模型对话。本文将带你从零开始了解LMQL的基本概念，并编写你的第一个提示查询程序。

环境准备

在开始编写LMQL程序前，你需要准备开发环境。LMQL提供了两种使用方式：

本地安装：适合需要完全控制开发环境或使用自托管模型的开发者。本地安装支持通过Transformers或llama.cpp等框架运行模型。
在线Playground：无需安装任何软件，直接在浏览器中编写和运行LMQL代码，适合快速体验和学习。

对于初学者，建议从在线Playground开始，这样可以跳过复杂的安装配置过程，直接体验LMQL的核心功能。

第一个LMQL程序：Hello World

让我们从一个最简单的"Hello World"示例开始：

"Say 'this is a test':[RESPONSE]" where len(TOKENS(RESPONSE)) < 25

这个简单的程序由两部分组成：

提示语句："Say 'this is a test':[RESPONSE]"是一个基本的提示模板，其中[RESPONSE]是一个占位符，表示我们希望模型生成的内容。
约束条件：where len(TOKENS(RESPONSE)) < 25限制了模型输出的长度不超过25个token（约等于25个单词）。

当运行这个程序时，模型会生成类似如下的输出：

Say this is a test: [RESPONSE| This is a test]

技术解析

LMQL的独特之处在于它将传统的字符串模板与编程逻辑完美结合：

模板变量：如[RESPONSE]这样的占位符会被模型自动填充。LMQL支持在单个提示中使用多个变量，实现复杂的交互逻辑。
实时约束：where子句中的条件会在生成过程中实时生效，而不是事后过滤。这意味着模型在生成每个token时都会考虑这些约束，确保最终输出完全符合要求。

进阶示例：带条件逻辑的提示

让我们扩展第一个示例，加入更复杂的控制逻辑：

sample(temperature=1.2)

"Say 'this is a test':[RESPONSE]" where len(TOKENS(RESPONSE)) < 25

if "test" not in RESPONSE:
    "You did not say 'test', try again:[RESPONSE]" where \
        len(TOKENS(RESPONSE)) < 25
else:
    "Good job"

这个进阶示例展示了LMQL更强大的功能：

解码器声明：sample(temperature=1.2)指定了文本生成的策略。这里我们使用采样(sample)解码而非默认的确定性解码(argmax)，并设置温度参数为1.2以获得更多样化的输出。
条件分支：根据模型第一次生成的响应是否包含"test"这个词，程序会走不同的分支。这种交互式提示允许我们根据模型的前期输出动态调整后续提示。
多轮交互：程序可以与模型进行多轮对话，每轮对话都能访问之前的上下文，实现真正的交互式体验。