LangChain回调处理器的事件监听机制深入解析(57)

最新推荐文章于 2025-12-20 11:51:30 发布

原创最新推荐文章于 2025-12-20 11:51:30 发布 · 974 阅读

22 ·

CC 4.0 BY-SA版权

文章标签：

#langchain #microsoft #网络 #人工智能 #深度学习

LangChain框架入门专栏收录该内容

90 篇文章

订阅专栏

LangChain回调处理器的事件监听机制深入解析

一、回调处理器概述

1.1 回调处理器的定义与作用

LangChain中的回调处理器（Callback Handler）是一种用于监听和响应框架内各类事件的机制。它允许开发者在关键事件发生时插入自定义逻辑，实现对流程的监控、日志记录、状态追踪等功能。从本质上讲，回调处理器通过事件监听机制，将LangChain的运行过程与外部自定义操作进行解耦，使得框架在保持核心功能稳定的同时，具备高度的可扩展性和灵活性。

在实际应用场景中，回调处理器发挥着至关重要的作用。例如，在构建智能问答系统时，通过回调处理器可以记录每次与语言模型交互的请求和响应，便于后续进行性能分析和错误排查；在复杂的链（Chain）执行过程中，回调处理器能够实时追踪各子任务的执行状态，为用户提供可视化的进度反馈；此外，在多轮对话场景下，回调处理器还可用于保存对话历史，实现上下文记忆功能。

1.2 与其他模块的关系

回调处理器并非孤立存在，而是与LangChain的多个核心模块紧密协作：

语言模型（LLM）模块：当语言模型进行推理或生成文本时，会触发相关事件（如on_llm_start、on_llm_end），回调处理器可捕获这些事件，记录模型调用的参数和结果，用于性能优化或安全审计。
链（Chain）模块：链在执行过程中（如子链调用、中间结果生成）会触发一系列事件，回调处理器可以监听这些事件，实现对复杂任务流程的监控和干预。
工具（Tool）模块：工具在调用前后（如on_tool_start、on_tool_end）会发出事件通知，回调处理器可借此记录工具的使用情况，评估工具调用的有效性。
内存（Memory）模块：内存数据更新时（如对话历史保存、上下文加载），回调处理器能够响应相关事件，执行额外的存储或处理逻辑。

1.3 核心应用场景

回调处理器的应用场景广泛，涵盖以下几个方面：

日志记录与监控：记录LangChain运行过程中的关键事件和数据，生成详细的日志，帮助开发者定位问题和分析性能瓶颈。
进度追踪与反馈：在长耗时任务中，实时捕获任务进度事件，向用户展示任务执行状态，提升用户体验。
数据持久化：在特定事件发生时（如链执行完成、工具调用成功），将相关数据保存到数据库或文件系统，实现数据的持久化存储。
自定义业务逻辑：根据应用需求，在事件触发时执行自定义操作，如发送通知、调用外部API、触发工作流等。

二、事件类型与生命周期

2.1 核心事件分类

LangChain定义了多种类型的事件，覆盖了从语言模型调用到链执行的全流程，主要可分为以下几类：

语言模型事件：
- on_llm_start：在语言模型开始处理请求时触发，传递模型调用的参数（如提示词、参数配置）。
- on_llm_new_token：当语言模型生成新的Token时触发，可用于实时展示模型生成的文本。
- on_llm_end：在语言模型完成响应时触发，传递完整的生成结果。
- on_llm_error：当语言模型调用出现错误时触发，携带错误信息用于异常处理。
链事件：
- on_chain_start：链开始执行时触发，传递链的名称和输入参数。
- on_chain_end：链执行结束时触发，传递链的输出结果。
- on_chain_error：链执行过程中出现错误时触发，携带错误详情。
工具事件：
- on_tool_start：工具开始调用时触发，传递工具名称和输入参数。
- on_tool_end：工具调用完成时触发，传递工具的输出结果。
- on_tool_error：工具调用失败时触发，携带错误信息。
其他事件：
- on_text：处理文本相关操作时触发，可用于通用的文本处理逻辑。
- on_agent_action：智能代理（Agent）执行动作时触发，记录代理的决策过程。
- on_agent_finish：智能代理完成任务时触发，传递最终结果。

2.2 事件生命周期

LangChain中事件的生命周期遵循“触发 - 传播 - 处理”的流程：

事件触发：当LangChain的核心组件（如LLM、链、工具）执行到特定阶段时，会调用相应的事件触发方法，生成事件对象。例如，语言模型在接收到请求后，会调用on_llm_start方法触发启动事件。
事件传播：事件对象会被传递给注册的回调处理器列表，按照注册顺序依次通知每个处理器。这一过程确保所有监听该事件的处理器都能接收到通知。
事件处理：回调处理器接收到事件后，执行其内部定义的处理逻辑。不同的处理器可以对同一事件进行不同的处理，实现功能的多样性。

2.3 事件与回调的映射关系

每个事件类型对应一个或多个回调方法，开发者通过实现这些方法来自定义事件处理逻辑。例如，on_llm_start事件对应回调处理器中的on_llm_start方法：

class CustomCallbackHandler(BaseCallbackHandler):
    def on_llm_start(self, serialized, prompts, **kwargs):
        """处理语言模型启动事件"""
        print(f"LLM started with prompts: {prompts}")

这种映射关系使得事件监听机制具有清晰的结构，便于开发者理解和扩展。

三、回调处理器的核心类与接口

3.1 `BaseCallbackHandler`类定义

BaseCallbackHandler是所有回调处理器的基类，定义了处理各类事件的抽象方法，其核心源码如下：

class BaseCallbackHandler(ABC):
    """回调处理器基类，定义事件处理的抽象方法"""
    def on_llm_start(
        self, serialized: Dict[str, Any], prompts: List[str], **kwargs: Any
    ) -> Any:
        """语言模型启动时的回调方法，默认空实现"""
        pass

    def on_llm_new_token(self, token: str, **kwargs: Any) -> Any:
        """语言模型生成新Token时的回调方法，默认空实现"""
        pass

    def on_llm_end(self, response: LLMResult, **kwargs: Any) -> Any:
        """语言模型结束时的回调方法，默认空实现"""
        pass

    def on_llm_error(
        self, error: Union[Exception, KeyboardInterrupt], **kwargs: Any
    ) -> Any:
        """语言模型出错时的回调方法，默认空实现"""
        pass

    def on_chain_start(
        self, serialized: Dict[str, Any], inputs: Dict[str, Any], **kwargs: Any
    ) -> Any:
        """链启动时的回调方法，默认空实现"""
        pass

    def on_chain_end(self, outputs: Dict[str, Any], **kwargs: Any) -> Any:
        """链结束时的回调方法，默认空实现"""
        pass

    def on_chain_error(
        self, error: Union[Exception, KeyboardInterrupt], **kwargs: Any
    ) -> Any:
        """链出错时的回调方法，默认空实现"""
        pass

    def on_tool_start(
        self, serialized: Dict[str, Any], input_str: str, **kwargs: Any
    ) -> Any:
        """工具启动时的回调方法，默认空实现"""
        pass

    def on_tool_end(self, output: str, **kwargs: Any) -> Any:
        """工具结束时的回调方法，默认空实现"""
        pass

    def on_tool_error(
        self, error: Union[Exception, KeyboardInterrupt], **kwargs: Any
    ) -> Any:
        """工具出错时的回调方法，默认空实现"""
        pass

    def on_text(self, text: str, **kwargs: Any) -> Any:
        """处理文本时的回调方法，默认空实现"""
        pass

    def on_agent_action(self, action: AgentAction, **kwargs: Any) -> Any:
        """智能代理执行动作时的回调方法，默认空实现"""
        pass

    def on_agent_finish(self, finish: AgentFinish, **kwargs: Any) -> Any:
        """智能代理完成任务时的回调方法，默认空实现"""
        pass

该基类为每种事件类型提供了对应的抽象方法，子类通过重写这些方法实现具体的处理逻辑。

3.2 常用子类与功能

LangChain提供了多个BaseCallbackHandler的子类，实现了不同的实用功能：

ConsoleCallbackHandler：将事件信息打印到控制台，用于调试和快速查看运行状态。

class ConsoleCallbackHandler(BaseCallbackHandler):
    def on_llm_start(self, serialized, prompts, **kwargs):
        print(f"LLM started: {prompts}")
        
    def on_llm_end(self, response, **kwargs):
        print(f"LLM finished with result: {response}")

FileCallbackHandler：将事件信息写入文件，实现日志的持久化存储。

class FileCallbackHandler(BaseCallbackHandler):
    def __init__(self, file_path):
        self.file_path = file_path
        
    def on_chain_end(self, outputs, **kwargs):
        with open(self.file_path, "a") as f:
            f.write(f"Chain ended with output: {outputs}\n")

StreamlitCallbackHandler：结合Streamlit框架，实时展示任务进度和结果，提升用户交互体验。

3.3 接口设计原理

LangChain的回调处理器接口设计遵循“开放 - 封闭”原则：

开放性：通过BaseCallbackHandler提供统一的事件处理接口，开发者可自由创建自定义回调处理器，扩展框架功能。
封闭性：LangChain的核心组件（LLM、链、工具）仅依赖BaseCallbackHandler接口，不关心具体的处理器实现，确保核心逻辑的稳定性。

这种设计使得回调处理器机制既能满足多样化的需求，又不会对框架的原有功能造成影响。

四、事件监听与触发机制源码解析

4.1 事件监听的注册过程

在LangChain中，回调处理器的注册是事件监听的前提。核心组件（如LLMChain、AgentExecutor）通过callbacks参数接收回调处理器列表，并在内部维护一个处理器集合。以LLMChain为例，注册过程如下：

class LLMChain(Chain):
    def __init__(
        self,
        llm: BaseLLM,
        prompt: Union[PromptTemplate, StringPromptTemplate],
        callbacks: Optional[List[BaseCallbackHandler]] = None,
        **kwargs: Any,
    ):
        super().__init__(**kwargs)
        self.llm = llm
        self.prompt = prompt
        self.callbacks = callbacks or []  # 初始化回调处理器列表
        
    def _call(self, inputs: Dict[str, Any]) -> Dict[str, Any]:
        # 触发on_chain_start事件
        self.callback_manager.on_chain_start(
            serialized=self.serialize(), inputs=inputs
        )
        try:
            # 调用语言模型前触发on_llm_start事件
            self.callback_manager.on_llm_start(
                serialized=self.llm.serialize(),
                prompts=[self.prompt.format(**inputs)],
            )
            llm_result = self.llm(self.prompt.format(**inputs))
            # 语言模型生成新Token时触发on_llm_new_token事件
            for token in llm_result.generations[0][0].text:
                self.callback_manager.on_llm_new_token(token)
            # 语言模型结束时触发on_llm_end事件
            self.callback_manager.on_llm_end(llm_result)
            # 处理结果并触发on_chain_end事件
            output = self._process_llm_result(llm_result)
            self.callback_manager.on_chain_end(output)
            return output
        except (Exception, KeyboardInterrupt) as e:
            # 出错时触发on_llm_error和on_chain_error事件
            self.callback_manager.on_llm_error(e)
            self.callback_manager.on_chain_error(e)
            raise

在上述代码中，LLMChain在执行过程的关键节点，通过callback_manager调用相应的事件方法，实现事件的触发。

4.2 事件触发的核心逻辑

事件触发的核心逻辑集中在CallbackManager类中，它负责管理回调处理器列表，并按顺序调用处理器的事件方法：

class CallbackManager:
    def __init__(self, handlers: Optional[List[BaseCallbackHandler]] = None):
        self.handlers = handlers or []  # 存储注册的回调处理器
        
    def on_llm_start(
        self, serialized: Dict[str, Any], prompts: List[str], **kwargs: Any
    ) -> Any:
        """触发语言模型启动事件"""
        for handler in self.handlers:
            handler.on_llm_start(serialized, prompts, **kwargs)
            
    def on_llm_new_token(self, token: str, **kwargs: Any) -> Any:
        """触发语言模型生成新Token事件"""
        for handler in self.handlers:
            handler.on_llm_new_token(token, **kwargs)
            
    # 其他事件触发方法（on_llm_end、on_chain_start等）类似，均遍历调用处理器方法

CallbackManager通过遍历注册的处理器列表，依次调用每个处理器对应的事件方法，实现事件的传播和处理。

4.3 事件传播的控制机制

为了避免无效的事件传播或循环调用，LangChain设计了多种控制机制：

事件过滤：部分处理器可以选择性地处理特定类型的事件，通过在方法中添加条件判断实现。

class SelectiveHandler(BaseCallbackHandler):
    def on_llm_start(self, serialized, prompts, **kwargs):
        if "important_task" in prompts[0]:
            super().on_llm_start(serialized, prompts, **kwargs)

传播终止：在某些场景下，需要提前终止事件传播。例如，当一个处理器处理失败时，可以抛出异常中断后续处理器的调用。

class FailingHandler(BaseCallbackHandler):
    def on_chain_start(self, serialized, inputs, **kwargs):
        raise ValueError("Handler failed")
        # 后续处理器不会被调用

五、自定义回调处理器的实现

5.1 基础实现步骤

创建自定义回调处理器需遵循以下步骤：

继承基类：从BaseCallbackHandler派生新类。

class MyCustomHandler(BaseCallbackHandler):
    pass

重写事件方法：根据需求重写一个或多个事件处理方法。

class MyCustomHandler(BaseCallbackHandler):
    def on_llm_end(self, response, **kwargs):
        print(f"LLM generated: {response.generations[0][0].text}")

注册处理器：将自定义处理器添加到目标组件的callbacks参数中。

llm_chain = LLMChain(
    llm=OpenAI(),
    prompt=PromptTemplate(input_variables=["question"], template="Answer: {question}"),
    callbacks=[MyCustomHandler()]
)

5.2 复杂逻辑实现

除了简单的日志记录，自定义回调处理器还可以实现复杂的业务逻辑：

数据聚合：在链执行过程中收集中间结果，用于后续分析。

class ResultAggregator(BaseCallbackHandler):
    def __init__(self):
        self.results = []
        
    def on_chain_end(self, outputs, **kwargs):
        self.results.append(outputs)
        
    def get_aggregated_results(self):
        return self.results

状态机控制：根据事件顺序控制状态转换，实现有限状态机逻辑。

class StateMachineHandler(BaseCallbackHandler):
    def __init__(self):
        self.state = "INIT"
        
    def on_llm_start(self, serialized, prompts, **kwargs):
        if self.state == "INIT":
            self.state = "PROCESSING"
            
    def on_llm_end(self, response, **kwargs):
        if self.state == "PROCESSING":
            self.state = "FINISHED"

5.3 与外部系统集成

自定义回调处理器可以方便地与外部系统集成，例如：

发送HTTP请求：在事件触发时调用外部API。

import requests

class APINotifier(BaseCallbackHandler):
    def on_chain_end(self, outputs, **kwargs):
        requests.post("https://example.com/webhook", json=outputs)

操作数据库：将事件数据保存到数据库中。

import sqlite3

class DatabaseLogger(BaseCallbackHandler):
    def __init__(self, db_path):
        self.db_path = db_path
        self.conn = sqlite3.connect(db_path)
        self.cursor = self.conn.cursor()
        self.cursor.execute('''
            CREATE TABLE IF NOT EXISTS langchain_events (
                id INTEGER PRIMARY KEY AUTOINCREMENT,
                event_type TEXT,
                data TEXT,
                timestamp DATETIME DEFAULT CURRENT

六、回调处理器的组合与嵌套使用

6.1 多处理器协同工作原理

在实际应用中，单一回调处理器往往无法满足复杂需求，需要多个处理器协同工作。LangChain支持将多个回调处理器组合使用，它们会按照注册顺序依次处理同一事件，实现功能的叠加与互补。

从源码层面看，CallbackManager类在触发事件时，会遍历所有注册的处理器并调用对应方法。例如在处理on_llm_end事件时：

class CallbackManager:
    def __init__(self, handlers: Optional[List[BaseCallbackHandler]] = None):
        self.handlers = handlers or []  # 存储注册的回调处理器
        
    def on_llm_end(self, response: LLMResult, **kwargs: Any) -> Any:
        """触发语言模型结束事件"""
        for handler in self.handlers:
            handler.on_llm_end(response, **kwargs)

假设系统中注册了ConsoleCallbackHandler用于打印日志、FileCallbackHandler用于保存结果到文件，当语言模型调用结束，CallbackManager会先调用ConsoleCallbackHandler的on_llm_end方法输出信息到控制台，再调用FileCallbackHandler的对应方法进行文件写入。

6.2 嵌套回调处理器的实现

除了并列组合，回调处理器还能实现嵌套使用，即一个处理器内部可以包含其他处理器，形成层级化的事件处理结构。这种方式适用于需要对事件进行分级处理或针对特定场景定制处理流程的情况。

以一个包含子处理器的自定义处理器为例：

class ParentCallbackHandler(BaseCallbackHandler):
    def __init__(self, child_handler):
        self.child_handler = child_handler  # 子处理器
        
    def on_llm_start(self, serialized, prompts, **kwargs):
        print("Parent handler: LLM start event received")
        self.child_handler.on_llm_start(serialized, prompts, **kwargs)  # 调用子处理器方法
        
    def on_llm_end(self, response, **kwargs):
        print("Parent handler: LLM end event received")
        self.child_handler.on_llm_end(response, **kwargs)

当ParentCallbackHandler接收到事件时，除了执行自身的逻辑，还会将事件传递给子处理器，实现更细致的处理分工。在注册时，可将ParentCallbackHandler作为整体添加到CallbackManager中，从而统一管理嵌套结构下的事件处理。

6.3 处理器优先级与冲突解决

多个回调处理器协同工作时，可能会出现处理顺序或逻辑冲突的问题。为解决这类问题，LangChain虽然未内置严格的优先级机制，但开发者可通过设计处理器执行逻辑来模拟优先级效果。

例如，通过在处理器的事件方法中添加条件判断，决定是否继续传递事件给后续处理器：

class HighPriorityHandler(BaseCallbackHandler):
    def on_chain_error(self, error, **kwargs):
        print("High priority handler: Error handling started")
        # 若错误已处理，不再传递给其他处理器
        if self._handle_error(error): 
            return
        super().on_chain_error(error, **kwargs)
        
    def _handle_error(self, error):
        # 自定义错误处理逻辑
        return True if isinstance(error, SpecificErrorType) else False

这种方式下，HighPriorityHandler会优先尝试处理错误，若成功则阻断事件传播，避免其他处理器重复处理；若失败，则将事件传递给后续处理器，确保错误得到充分处理。

七、回调处理器与异步操作的结合

7.1 异步事件处理的必要性

随着LangChain应用场景向高并发、实时性方向发展，同步的回调处理方式可能导致性能瓶颈。例如，在处理大量语言模型请求时，若回调处理器执行耗时操作（如写入大型日志文件、调用外部缓慢API），会阻塞主线程，影响整体响应速度。因此，引入异步机制让回调处理器支持非阻塞操作十分必要。

7.2 异步回调处理器的源码实现

LangChain通过AsyncBaseCallbackHandler基类支持异步回调处理，其核心定义如下：

class AsyncBaseCallbackHandler(ABC):
    async def on_llm_start(
        self, serialized: Dict[str, Any], prompts: List[str], **kwargs: Any
    ) -> Any:
        """异步处理语言模型启动事件，默认空实现"""
        pass
    
    async def on_llm_new_token(self, token: str, **kwargs: Any) -> Any:
        """异步处理新Token生成事件，默认空实现"""
        pass
    
    # 其他异步事件处理方法类似，均为async def定义

自定义异步处理器需继承该类并实现异步方法。例如，一个异步保存日志到云端的处理器：

import aiohttp

class AsyncCloudLogger(AsyncBaseCallbackHandler):
    def __init__(self, api_url):
        self.api_url = api_url
        
    async def on_llm_end(self, response, **kwargs):
        async with aiohttp.ClientSession() as session:
            async with session.post(self.api_url, json=response.dict()) as resp:
                await resp.text()

在使用异步处理器时，AsyncCallbackManager类负责协调异步事件的触发与处理：

class AsyncCallbackManager:
    def __init__(self, handlers: Optional[List[AsyncBaseCallbackHandler]] = None):
        self.handlers = handlers or []
        
    async def on_llm_end(self, response: LLMResult, **kwargs: Any) -> Any:
        """异步触发语言模型结束事件"""
        for handler in self.handlers:
            await handler.on_llm_end(response, **kwargs)

AsyncCallbackManager通过await关键字等待每个处理器的异步方法执行完毕，确保事件处理的完整性与顺序性。

7.3 异步与同步混合使用策略

实际应用中，可能同时存在异步和同步回调处理器。LangChain支持混合使用模式，但需注意事件处理的协调。一种常见策略是将异步操作封装在异步处理器中，而同步操作保留在同步处理器内，通过CallbackManager和AsyncCallbackManager分别管理。

例如，在一个系统中，ConsoleCallbackHandler（同步）用于即时打印日志，AsyncCloudLogger（异步）用于后台保存数据到云端：

# 同步处理器
sync_handler = ConsoleCallbackHandler()
# 异步处理器
async_handler = AsyncCloudLogger(api_url="https://example.com/log")

# 分别管理
sync_manager = CallbackManager([sync_handler])
async_manager = AsyncCallbackManager([async_handler])

# 在不同组件中使用对应的管理器
llm_chain_sync = LLMChain(llm=llm, prompt=prompt, callback_manager=sync_manager)
llm_chain_async = LLMChain(llm=llm, prompt=prompt, callback_manager=async_manager)

这种方式既保证了同步操作的即时反馈，又利用异步操作提升了系统整体的并发处理能力。

八、回调处理器的性能优化与资源管理

8.1 减少不必要的事件处理

回调处理器在频繁触发事件的场景下，可能因过度处理导致性能下降。例如，on_llm_new_token事件会在语言模型生成每个Token时触发，若处理器执行复杂逻辑，将消耗大量资源。为优化性能，可通过添加条件判断，过滤不必要的事件处理。

class TokenFilterHandler(BaseCallbackHandler):
    def __init__(self, filter_keywords):
        self.filter_keywords = filter_keywords
        
    def on_llm_new_token(self, token: str, **kwargs):
        # 仅当Token包含特定关键词时才处理
        if any(keyword in token for keyword in self.filter_keywords): 
            super().on_llm_new_token(token, **kwargs)

上述处理器仅在Token包含指定关键词时才执行后续逻辑，减少了无效处理开销。

8.2 资源释放与缓存策略

部分回调处理器可能占用外部资源（如数据库连接、文件句柄），若不及时释放，会导致资源耗尽。因此，在处理器设计中需重视资源的管理与释放。

以文件写入处理器为例：

class SafeFileHandler(BaseCallbackHandler):
    def __init__(self, file_path):
        self.file_path = file_path
        self.file = open(self.file_path, "a")  # 打开文件
        
    def on_chain_end(self, outputs, **kwargs):
        try:
            self.file.write(str(outputs) + "\n")
        except Exception as e:
            print(f"File write error: {e}")
        
    def __del__(self):
        self.file.close()  # 对象销毁时关闭文件

此外，对于重复处理的数据，可引入缓存机制。例如，在多次处理相同的语言模型响应结果时，可缓存已处理数据：

from functools import lru_cache

class CachingHandler(BaseCallbackHandler):
    @lru_cache(maxsize=128)
    def process_response(self, response):
        # 复杂的响应处理逻辑
        return processed_result
    
    def on_llm_end(self, response, **kwargs):
        result = self.process_response(response)
        # 后续操作

lru_cache装饰器会缓存process_response方法的调用结果，相同输入时直接返回缓存值，提升处理效率。

8.3 监控与性能分析

为进一步优化回调处理器性能，可通过添加监控代码分析其执行效率。例如，在处理器方法中记录执行时间：

import time

class TimingHandler(BaseCallbackHandler):
    def on_llm_start(self, serialized, prompts, **kwargs):
        self.start_time = time.time()
        
    def on_llm_end(self, response, **kwargs):
        elapsed_time = time.time() - self.start_time
        print(f"LLM processing time: {elapsed_time} seconds")

通过分析各处理器的耗时数据，可定位性能瓶颈，针对性地优化代码逻辑或调整资源分配策略。

九、回调处理器的安全与错误处理

9.1 输入验证与安全防护

回调处理器接收的事件数据可能包含不可信输入，若处理不当易引发安全风险（如代码注入、数据泄露）。因此，需对输入数据进行严格验证和过滤。

以处理用户输入的on_text事件为例：

import re

class SafeTextHandler(BaseCallbackHandler):
    def on_text(self, text: str, **kwargs):
        # 过滤危险字符
        sanitized_text = re.sub(r'[<>;|&]', '', text) 
        # 后续处理sanitized_text

此外，对于涉及敏感操作（如文件读写、网络请求）的处理器，需进行权限控制，确保操作在安全范围内执行。

9.2 错误捕获与恢复机制

回调处理器在执行过程中可能因各种原因出错（如网络中断、文件权限不足），为避免错误扩散影响主流程，需建立完善的错误捕获与恢复机制。

在处理器方法中使用try-except块捕获异常：

class RobustFileHandler(BaseCallbackHandler):
    def __init__(self, file_path):
        self.file_path = file_path
        
    def on_chain_end(self, outputs, **kwargs):
        try:
            with open(self.file_path, "a") as f:
                f.write(str(outputs) + "\n")
        except FileNotFoundError:
            print("File not found, creating a new one")
            with open(self.file_path, "w") as f:
                f.write(str(outputs) + "\n")
        except Exception as e:
            print(f"Unexpected error: {e}")

对于可恢复的错误（如文件丢失），处理器可尝试自动修复；对于不可恢复的错误，需记录日志并向上层抛出，由调用方决定后续处理策略。

9.3 安全审计与日志记录

为保障系统安全，需对回调处理器的操作进行审计。通过详细记录事件处理过程中的关键信息（如输入数据、执行结果、异常信息），便于追溯问题和分析安全隐患。

import logging

class AuditHandler(BaseCallbackHandler):
    def __init__(self):
        self.logger = logging.getLogger(__name__)
        self.logger.setLevel(logging.INFO)
        formatter = logging.Formatter('%(asctime)s - %(message)s')
        ch = logging.StreamHandler()
        ch.setFormatter(formatter)
        self.logger.addHandler(ch)
        
    def on_llm_end(self, response, **kwargs):
        self.logger.info(f"LLM response: {response}")
        
    def on_chain_error(self, error, **kwargs):
        self.logger.error(f"Chain error: {error}")