解析JSON输出的现代方法：使用JsonOutputParser-优快云博客

本文链接：https://blog.youkuaiyun.com/aGRGWRF/article/details/144462769

# 解析JSON输出的现代方法：使用JsonOutputParser

## 引言

在现代应用程序开发中，结构化数据的处理是一个常见的需求，尤其是在交互式AI模型中。本文将深入探讨如何使用`JsonOutputParser`解析JSON输出，帮助开发者创建符合预期数据结构的输出，无论是初学者还是经验丰富的开发者都能从中获益。

## 主要内容

### 理解JSON输出解析器

JSON输出解析器允许用户定义一个JSON模式，通过提示语言模型生成符合该模式的输出。虽然某些模型提供内置的方法来返回结构化输出，但并非所有都支持。我们可以借助输出解析器来确保输出的有效性，尤其是通过`JsonOutputParser`这样强大的工具。

### 定义数据结构

使用Python的`Pydantic`库可以方便地声明预期的JSON格式。以下是通过Pydantic定义笑话结构的示例：

```python
from langchain_core.pydantic_v1 import BaseModel, Field

# 设定期望的数据结构
class Joke(BaseModel):
    setup: str = Field(description="设置笑话的问题")
    punchline: str = Field(description="笑话的答案")

设置语言模型查询

通过提示模板和解析器，能够将期望的输出格式指示传递给语言模型：

from langchain_core.prompts import PromptTemplate
from langchain_core.output_parsers import JsonOutputParser
from langchain_openai import ChatOpenAI

model = ChatOpenAI(temperature=0)

joke_query = "Tell me a joke."

parser = JsonOutputParser(pydantic_object=Joke)

prompt = PromptTemplate(
    template="回答用户查询。\n{format_instructions}\n{query}\n",
    input_variables=["query"],
    partial_variables={"format_instructions": parser.get_format_instructions()},
)

chain = prompt | model | parser

chain.invoke({"query": joke_query})

使用流式传输输出

JsonOutputParser支持流式传输输出部分JSON对象，这对于需要动态更新UI的应用相当有用：

for s in chain.stream({"query": joke_query}):
    print(s)

在没有Pydantic的情况下使用

即使不使用Pydantic，也可以通过JsonOutputParser简化JSON的生成和解析：

parser = JsonOutputParser()

chain = prompt | model | parser

chain.invoke({"query": joke_query})

代码示例

以下是完整代码示例，展示从查询语言模型到解析JSON输出的整个过程：

from langchain_core.prompts import PromptTemplate
from langchain_core.output_parsers import JsonOutputParser
from langchain_core.pydantic_v1 import BaseModel, Field
from langchain_openai import ChatOpenAI

# 初始化模型
model = ChatOpenAI(temperature=0)

# 定义笑话数据结构
class Joke(BaseModel):
    setup: str = Field(description="设置笑话的问题")
    punchline: str = Field(description="笑话的答案")

# 定义查询
joke_query = "Tell me a joke."

# 设置解析器
parser = JsonOutputParser(pydantic_object=Joke)

# 创建提示模板
prompt = PromptTemplate(
    template="回答用户查询。\n{format_instructions}\n{query}\n",
    input_variables=["query"],
    partial_variables={"format_instructions": parser.get_format_instructions()},
)

# 构建查询链
chain = prompt | model | parser

# 执行查询
chain.invoke({"query": joke_query})