langchain agent结构化输出

路边草随风

于 2025-12-17 14:58:58 发布

阅读量526

点赞数 28

CC 4.0 BY-SA版权

分类专栏： langchain 文章标签： langchain python 人工智能

本文链接：https://blog.youkuaiyun.com/luohualiushui1/article/details/156017186

langchain 专栏收录该内容

4 篇文章

订阅专栏

一.背景

LangChain Agent 作为大模型驱动的自主决策智能体，核心价值在于通过工具调用与逻辑推理完成复杂任务，但原生 Agent 的输出多为非结构化自然语言文本 —— 这种 “自由文本” 形式在企业级应用中，难以满足数据存储、系统集成、自动化流转的核心需求。“结构化输出” 能力通过定义标准化数据格式（如 JSON、CSV、指定字段结构），让 Agent 输出具备固定结构、机器可解析的结果，是 LangChain Agent 从 “人机交互工具” 升级为 “系统协同组件” 的关键，其需求源于非结构化输出在业务落地中的核心痛点，也是 Agent 适配企业级 “数据标准化、流程自动化、跨系统协作” 诉求的必要支撑。

1.LangChain Agent 非结构化输出的核心痛点

LangChain 原生 Agent 未强制约束输出格式，默认按自然语言生成结果，这种非结构化输出在实际业务场景中暴露诸多致命问题，严重阻碍 Agent 的产业化落地：

1. 机器无法直接解析，难以集成到业务系统

企业级应用中，Agent 输出结果常需对接后续业务系统（如数据库存储、ERP 系统、工作流引擎），这些系统要求输入数据具备固定格式（如 JSON 字段、数据库表结构）。非结构化文本无法被系统直接解析：

例如，Agent 完成 “客户订单查询” 后，输出 “客户张三的订单号为 OD20250101001，下单时间是 2025-01-01，订单金额 1999 元”，业务系统无法自动提取 “订单号”“下单时间” 等关键字段，需人工录入或额外开发复杂的文本解析逻辑，效率极低；
若 Agent 输出格式不固定（如有时先说订单号，有时先说金额），解析逻辑需不断适配，维护成本剧增，甚至导致解析失败。

2. 数据难以标准化存储与检索

非结构化输出的文本缺乏统一格式，无法直接存入结构化存储介质（如数据库表、数据仓库），也难以实现精准检索：

例如，多个 Agent 处理不同客户的售后工单，输出结果为自由文本，无法按 “工单类型”“处理状态”“客户 ID” 等维度分类存储，后续统计 “月度售后工单量”“高频问题类型” 时，需手动整理数据，无法实现自动化分析；
检索特定条件的结果时（如 “查询 2025 年 1 月金额大于 1000 元的订单”），非结构化文本无法支持精准筛选，只能通过模糊匹配，结果准确性差。

3. 多步骤 / 多 Agent 协作时，信息传递低效

复杂业务常需多个 Agent 协同或单 Agent 多步骤执行，非结构化输出导致信息传递时需重复解析与提取，效率低下且易出错：

例如，“订单审核→财务结算→物流发货” 的多 Agent 协作流程中，订单审核 Agent 输出非结构化审核结果，财务结算 Agent 需先解析文本提取 “订单号”“应付金额” 等信息，再执行结算操作，增加协作延迟；
若文本中存在歧义（如 “金额 1999” 未说明是人民币还是美元），后续 Agent 可能误解信息，导致协作失败。

4. 结果准确性难以校验，容错率低

非结构化输出缺乏明确的字段定义与格式约束，Agent 可能遗漏关键信息或输出错误格式，且难以被自动校验：

例如，Agent 生成 “用户信息” 时，遗漏 “手机号” 字段或手机号格式错误（如少一位数字），非结构化文本中难以快速识别该问题，可能导致后续业务（如短信通知）失败；
企业级场景中，需人工逐一校验输出结果的完整性与准确性，增加人力成本，且无法实现实时校验。

5. 无法满足合规与审计要求

金融、政企等行业对业务数据的输出格式、字段完整性有严格的合规要求，非结构化输出无法提供明确的字段追溯与格式证明：

例如，金融行业的贷款审批 Agent 输出非结构化审批结果，无法明确 “审批结论”“风险评分”“审批人” 等必填字段，合规审计时无法提供有效证据，可能面临监管处罚；
非结构化输出的信息缺乏固定维度，难以实现数据溯源，无法追踪 “某字段信息的生成依据”，不符合合规要求。

2.LangChain Agent 结构化输出的核心价值

LangChain Agent 结构化输出，本质是通过 “格式定义 + Prompt 引导 + 结果校验” 的闭环机制，让 Agent 严格按照预设的标准化格式（如 JSON Schema、固定字段结构）生成结果，确保输出具备 “机器可解析、数据可存储、协作可复用、合规可追溯” 的特性。这一能力解决了非结构化输出的痛点，核心价值体现在：

1. 无缝集成业务系统，实现自动化流转

结构化输出（如 JSON、CSV）可被业务系统直接解析，无需额外开发复杂的文本提取逻辑，实现 Agent 与现有系统的无缝对接：

例如，订单查询 Agent 按预设 JSON 格式输出{"customer_name": "张三", "order_id": "OD20250101001", "order_time": "2025-01-01", "amount": 1999}，业务系统可直接读取字段值存入数据库，或触发后续的订单处理流程，实现端到端自动化；
标准化格式让 Agent 成为业务系统的 “插件式组件”，大幅降低系统集成成本。

2. 支持结构化存储与精准检索，提升数据价值

结构化输出的字段化数据可直接存入数据库、数据仓库等结构化存储介质，支持多维度筛选与精准检索：

例如，售后工单 Agent 输出包含 “ticket_id”“customer_id”“problem_type”“handle_status” 等字段的结构化数据，可按 “problem_type” 统计高频问题，按 “handle_status” 筛选未处理工单，实现自动化数据分析；
检索时可通过字段精准匹配（如 “查询 order_id=OD20250101001 的订单”），大幅提升检索效率与准确性。

3. 优化多步骤 / 多 Agent 协作，降低沟通成本

结构化输出的字段化信息可被其他 Agent 或步骤直接复用，无需重复解析，提升协作效率与准确性：

例如，多 Agent 协作流程中，前序 Agent 输出的结构化数据可直接作为后序 Agent 的输入参数（如财务结算 Agent 直接读取 “order_id”“amount” 字段执行结算），避免信息传递中的歧义与错误；
标准化格式让不同 Agent 之间的协作 “有章可循”，降低协作逻辑的复杂度，支撑更复杂的业务流程。

4. 实现结果自动校验，提升输出可靠性

结构化输出可通过格式校验工具（如 JSON Schema 校验、字段类型校验）自动检测结果的完整性与准确性：

例如，预设 JSON Schema 要求 “手机号” 字段为 11 位数字，若 Agent 输出错误格式，校验工具可实时拦截并触发 Agent 修正（如重新调用工具获取正确手机号），无需人工干预；
校验机制确保输出数据的字段完整、格式正确，大幅提升 Agent 结果的可靠性，降低后续业务风险。

5. 满足合规与审计要求，降低合规风险

结构化输出的固定字段与格式可明确记录业务所需的关键信息，满足合规审计对数据追溯与完整性的要求：

例如，贷款审批 Agent 按结构化格式输出{"approval_result": "通过", "risk_score": 85, "approver": "李四", "approval_time": "2025-01-02"}，合规审计时可清晰追溯审批的关键信息与依据，符合行业监管要求；
结构化数据便于日志记录与审计跟踪，可完整保留输出结果的生成过程，满足合规追溯需求。

3.LangChain Agent 结构化输出的典型应用场景

企业级订单 / 工单管理系统：Agent 处理订单查询、工单创建等任务时，结构化输出订单号、工单状态等字段，直接对接数据库存储与业务流程引擎，实现自动化管理。
金融数据报送与审批：金融 Agent 生成贷款审批结果、财务报表数据时，按监管要求的结构化格式输出，满足合规报送与审计需求。
多智能体协作流程：如 “数据采集→分析→报告生成” 的多 Agent 协作，前序 Agent 结构化输出数据，后序 Agent 直接复用字段，提升协作效率。
API 接口响应生成：Agent 作为 API 后端，结构化输出 JSON 格式结果，直接对接前端系统，支撑 Web/APP 应用的开发。
自动化数据分析与报表：Agent 分析业务数据后，按固定字段（如指标名称、数值、时间维度）结构化输出，自动生成标准化报表存入数据仓库。

4.关键优势总结

LangChain Agent 结构化输出的核心价值，是将 Agent 输出从 “不可控的自然语言” 转化为 “可控的结构化数据”，解决了非结构化输出在系统集成、数据存储、协作效率、合规性上的痛点。它让 Agent 不仅能与用户交互，更能无缝融入企业现有 IT 架构，成为自动化业务流程的核心组件，大幅降低 Agent 产业化落地的成本与风险。这一能力是 LangChain Agent 从 “演示级工具” 升级为 “生产级系统” 的关键标志，也是支撑 Agent 在企业中规模化应用的核心技术支撑。

综上，LangChain Agent 结构化输出的需求，源于企业对 Agent 应用 “标准化、自动化、集成化” 的核心诉求：解决了非结构化输出的诸多落地障碍，支撑订单管理、金融合规、多 Agent 协作等核心业务场景，为 LangChain Agent 的产业化落地提供了关键保障。

二.具体实现

1.引入依赖

from langchain.agents import create_agent
import sys
import io
import os
from pydantic import BaseModel
from langchain.agents.structured_output import ToolStrategy

2.定义大模型参数

if sys.stdout.encoding != 'utf-8':
    sys.stdout.reconfigure(encoding='utf-8')
if sys.stderr.encoding != 'utf-8':
    sys.stderr.reconfigure(encoding='utf-8')
os.environ['PYTHONIOENCODING'] = 'utf-8'

os.environ["OPENAI_API_BASE"] = "xxxxx"
    

os.environ["OPENAI_API_KEY"] = "xxxxxx"

3.定义格式化输出类

class HumunInfo(BaseModel):
    name: str
    email: str
    phone: str
    gender: str
    nation: str
    height: str

4.定义agent

agent = create_agent(
    model="gpt-4.1-2025-04-14",
    response_format=ToolStrategy(HumunInfo)
)

5.执行agent

result = agent.invoke({
    "messages": [{"role": "user", "content": "我的名字叫做John Doe,我的邮箱是john@example.com,我的电话是(555) 123-4567，我的性别男，民族是汉族，身高1.8m"}]
})


print(result["structured_response"])

结果如下：