利用LM Format Enforcer实现高效JSON格式化：提升AI模型输出的稳定性

引言

在现代应用程序中，确保输出数据符合特定格式是一项重要的任务，尤其是在进行API交互或存储数据时。LM Format Enforcer是一个强大的库，专注于在语言模型输出中实现格式化控制。本文将介绍如何使用LM Format Enforcer来确保AI模型生成的输出符合预期的格式，尤其是在JSON格式化方面的应用。

主要内容

LM Format Enforcer的工作原理

LM Format Enforcer通过结合字符级解析器和分词器前缀树来过滤掉不符合格式的词元。此方式不仅支持批量生成，还能在很大程度上避免输出错误数据格式的问题。

模型设置与基线测试

在使用LM Format Enforcer之前，我们首先需要设置一个基础的语言模型，并对其输出进行基线测试。在这里，我们使用LLama2模型来生成基准输出。

import logging
from langchain_experimental.pydantic_v1 import BaseModel
import torch
from transformers import AutoConfig, AutoModelForCausalLM, AutoTokenizer

logging.basicConfig(level=logging.ERROR)

class PlayerInformation(BaseModel):
    first_name: str
    last_name: str
    num_seasons_in_nba: int
    year_of_birth: int

model_id = "meta-llama/Llama-2-7b-chat-hf"
device = "cuda"

if torch.cuda.is_available():
    config = AutoConfig.from_pretrained(model_id)
    config.pretraining_tp = 1
    model = AutoModelForCausalLM.from_pretrained(
        model_id,
        config=config,
        torch_dtype=torch.float16,
        load_in_8bit=True,
        device_map="auto",
    )
else:
    raise Exception("GPU not available")
tokenizer = AutoTokenizer.from_pretrained(model_id)
if tokenizer.pad_token_id is None:
    tokenizer.pad_token_id = tokenizer.eos_token_id

DEFAULT_SYSTEM_PROMPT = """\
You are a helpful, respectful and honest assistant...
"""

prompt = """Please give me information about {player_name}. You must respond using JSON format...
"""

强化输出格式

通过LM Format Enforcer，我们可以显著增强输出的格式准确性。首先，通过JSON Schema来指导输出：

from langchain_experimental.llms import LMFormatEnforcer

lm_format_enforcer = LMFormatEnforcer(
    json_schema=PlayerInformation.schema(), pipeline=hf_model
)
results = lm_format_enforcer.predict(get_prompt("Michael Jordan"))
print(results)

输出结果严格符合定义的JSON格式，从而减少了错误解析的风险。

代码示例

下面是一个使用LM Format Enforcer处理批量数据的示例：

prompts = [
    get_prompt(name) for name in ["Michael Jordan", "Kareem Abdul Jabbar", "Tim Duncan"]
]
results = lm_format_enforcer.generate(prompts)
for generation in results.generations:
    print(generation[0].text)

# 使用API代理服务提高访问稳定性