langgraph对流程进行中断

原创于 2025-12-10 16:20:47 发布 · 681 阅读

CC 4.0 BY-SA版权

文章标签：

一.背景

LangGraph 作为 LangChain 生态下专注于 “大模型应用流程编排” 的框架，核心价值是将复杂的大模型交互流程（如多轮对话、任务拆解、多智能体协作）抽象为可视化的有向图（StateGraph），支持流程的动态流转、状态持久化与多智能体协同。在企业级大模型应用落地中，“流程中断” 能力是保障应用稳定性、适配业务灵活性、满足合规管控的核心诉求 —— 其需求源于传统流程编排框架（如普通状态机、简单脚本）在大模型流程管理中 “不可控、不灵活、无容错” 的痛点，也是 LangGraph 从 “基础流程编排” 走向 “企业级生产可用” 的关键特性。

1.传统大模型流程编排的核心痛点

在 LangGraph 出现前，企业级大模型应用的流程编排（如智能客服对话流程、业务审批流程、多步骤数据分析流程）多依赖简单脚本、普通状态机或自研流程框架，这类方式无法灵活处理 “流程中断” 场景，核心痛点体现在：

流程刚性强，无法按需暂停 / 终止传统流程编排多为 “线性执行” 或 “固定分支执行”，一旦启动则必须执行至结束，无法根据业务场景按需中断：例如智能客服流程中，用户提出 “需要人工介入” 时，无法暂停大模型自动回复流程；数据分析流程中，检测到数据异常时，无法终止后续计算步骤，导致资源浪费或错误结果输出。
无状态持久化，中断后无法恢复即使通过硬编码实现流程暂停，传统框架也缺乏对 “中断时刻流程状态” 的结构化存储能力：例如多智能体协作的合同审核流程中，中断时已完成 “条款提取”“风险识别” 步骤，恢复时需重新执行所有步骤，无法从中断节点继续；且中断状态（如当前执行节点、已处理数据、上下文信息）易丢失，导致流程无法精准恢复。
异常处理能力弱，故障中断易引发崩溃大模型流程执行中易出现各类异常（如大模型 API 调用超时、数据解析失败、权限校验不通过），传统框架无法优雅中断流程：要么强制继续执行导致错误放大（如用失效数据继续分析），要么直接崩溃导致流程完全终止，且无法记录中断原因、定位故障节点，增加运维成本。
合规与管控诉求无法满足金融、政企等行业对流程执行有严格的合规管控要求：例如敏感数据处理流程中，检测到数据脱敏不达标时需立即中断流程并触发审计；审批流程中，管理员需手动中断违规的审批节点。但传统框架无精细化的中断权限管控、中断日志记录能力，无法满足等保、隐私保护等合规要求。
人机协同场景适配难企业级大模型应用多需 “人机协同”（如大模型处理基础步骤，人工处理复杂决策），传统流程编排无法实现 “流程中断→人工介入→流程恢复” 的闭环：例如智能合同审查流程中，大模型识别到高风险条款时，无法中断流程并将任务推送给人工审核，审核完成后也无法自动恢复流程，导致人机协同效率低下。

2.LangGraph 实现流程中断的核心价值

LangGraph 基于 “状态图 + 节点 / 边控制 + 状态持久化” 的核心设计，提供精细化的流程中断能力（包括主动中断、异常中断、人工触发中断），解决上述痛点，核心价值体现在：

灵活的中断触发机制，适配多场景需求LangGraph 支持在任意节点（Node）或边（Edge）配置中断条件，实现 “按需中断”：
- 主动中断：通过自定义逻辑（如检测到用户指令、业务规则触发）调用 interrupt() 方法中断流程；
- 异常中断：捕获节点执行异常（如大模型调用失败、数据校验错误）时自动中断流程；
- 人工中断：通过外部 API/UI 触发中断指令，暂停指定流程实例。例如在智能客服流程中，配置 “用户输入‘转人工’则中断自动回复节点”，实现流程的灵活管控。
状态持久化，中断后可精准恢复LangGraph 内置状态持久化能力（支持本地存储、Redis、PostgreSQL 等），中断时会自动保存当前流程的全量状态：包括当前执行节点、上下文数据、已完成步骤的结果、大模型交互记录等。恢复流程时可直接从中断节点继续执行，无需重新运行全流程，大幅提升效率。
优雅的异常中断处理，保障流程稳定性LangGraph 支持为每个节点配置异常处理器（Exception Handler），当节点执行异常时，可选择 “中断流程 + 记录日志”“跳转至容错节点”“重试节点” 等策略，避免流程崩溃：例如大模型 API 调用超时后，中断当前生成节点，跳转至 “人工复核” 节点，而非直接终止整个流程；同时自动记录中断时间、节点、原因，便于后续故障排查。
精细化管控，满足合规诉求LangGraph 可对接企业权限系统，实现 “谁能中断流程、中断哪些节点、中断后如何审计” 的精细化管控：
- 权限校验：仅授权角色（如管理员、合规审核员）可触发人工中断；
- 审计日志：记录中断操作人、时间、节点、原因，满足合规审计要求；
- 中断后处理：敏感流程中断后自动触发告警（如推送至飞书 / 钉钉），并冻结相关数据避免篡改。
支撑人机协同闭环，提升流程灵活性LangGraph 的流程中断能力是实现 “人机协同” 的核心基础：大模型流程执行中遇到无法处理的场景（如复杂风险决策、模糊用户需求）时，中断流程并将任务推送给人工；人工处理完成后，通过 LangGraph 的状态恢复能力继续执行后续流程，形成 “大模型处理→中断→人工介入→恢复执行” 的闭环。例如合同审查流程中，大模型识别到高风险条款后中断流程，推送至法务人员审核，审核完成后自动恢复流程并生成最终审查报告。

3.典型应用场景

企业级智能客服流程：客服对话流程中，用户提出复杂诉求（如 “投诉退款”）时，中断大模型自动回复流程，将对话转接人工坐席；人工处理完成后，恢复流程并记录处理结果。
多步骤数据分析流程：基于大模型的数据分析流程中，检测到数据源异常、计算结果超出合理范围时，中断后续计算步骤，触发数据校验告警，待人工确认后恢复流程。
智能合同审查流程：多智能体协作的合同审查流程中，识别到高风险条款、敏感数据未脱敏时，中断流程并推送至法务人员审核，审核通过后恢复流程继续完成审查。
业务审批自动化流程：大模型驱动的审批流程中，管理员发现审批节点违规、数据造假时，手动中断审批流程，核查完成后决定恢复或终止流程。
多模态内容生成流程：图文生成、视频脚本创作流程中，大模型生成内容不符合合规要求（如包含敏感信息）时，中断生成流程，触发内容审核，修改后恢复生成。

4.关键优势总结

LangGraph 实现流程中断的核心价值，是将大模型流程从 “不可控的线性执行” 转化为 “可管控、可暂停、可恢复的柔性流程”：既解决了传统流程编排 “刚性强、无容错、人机协同难” 的痛点，又通过状态持久化、精细化权限管控满足企业级生产环境的稳定性与合规要求。这一能力让 LangGraph 能够适配复杂的企业级业务场景，成为大模型应用从 “演示级” 走向 “生产级” 的关键支撑。

综上，LangGraph 实现流程中断的需求，源于企业对大模型流程 “可控性、容错性、合规性” 的核心诉求：解决了传统流程编排无法优雅处理中断、恢复的痛点，支撑人机协同、异常容错、合规管控等企业级核心场景，为复杂大模型应用的稳定落地提供了高效、可靠的技术路径。

二.具体实现

1.引入依赖

import sys
import io
# 设置标准输出编码为UTF-8，解决Windows中文乱码问题
if sys.platform == 'win32':
    sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf-8')
    sys.stderr = io.TextIOWrapper(sys.stderr.buffer, encoding='utf-8')

from IPython.display import Image, display
from langgraph.constants import START, END
from langgraph.graph import StateGraph
from langgraph.graph.state import CompiledStateGraph
from typing_extensions import TypedDict
import threading
import time
from apscheduler.schedulers.blocking import BlockingScheduler
import datetime
from langgraph.types import interrupt
from langgraph.types import Command
from langgraph.checkpoint.memory import MemorySaver

2.定义状态类

# 1. 定义状态
class EventState(TypedDict):

    count_status: int  #累计计数状态

3.定义节点1,节点2,其中节点2带中断逻辑

def first_node(state: EventState) -> EventState:

    state["count_status"] += 1

    print("当前计数状态：", state["count_status"])

    return state   


def second_node(state: EventState) -> EventState:

    approved = interrupt("继续往下走吗?")

    if approved == "是":
        state["count_status"] += 2
    else:
        pass

    print("当前计数状态：", state["count_status"])

    return state

4.构建图

    # 创建事件流
    graph = StateGraph(EventState)
    graph.add_node("first_node", first_node)
    graph.add_node("second_node", second_node)
    graph.add_edge(START, "first_node")
    graph.add_edge("first_node", "second_node")
    graph.add_edge("second_node", END)

    memory = MemorySaver()
    graph = graph.compile(checkpointer=memory)

5.发起流程

    # 初始化状态
    state = {"count_status": 0}

    config = {"configurable": {"thread_id": "thread-1"}}

    rs = graph.invoke(state, config=config)

可以看到流程到了节点1后，暂停了

6.人工介入，重启流程

    rs2 = graph.invoke(Command(resume="是"), config=config)
    print(rs2)

流程顺利执行完成