使用Arthur平台实现Chat LLM推理日志自动记录

最新推荐文章于 2025-11-25 12:54:41 发布

原创

最新推荐文章于 2025-11-25 12:54:41 发布 · 1k 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#microsoft #数据库 #服务器 #python

在现代AI开发中，模型监控和可观测性是确保模型可靠性和性能的重要组成部分。Arthur是一款专注于模型监控和可观测性的工具平台，它可以帮助开发者记录和分析模型推理的日志数据，提升模型应用的透明度和可控性。本指南将向您展示如何结合Arthur回调处理器和LangChain框架，将Chat型大语言模型(LLM)的推理记录自动上传至Arthur平台。

技术背景介绍

通常，在构建复杂的LLM应用时，我们需要解决以下问题：

模型推理的可追溯性：如何记录模型的输入输出历史，以便后续分析。
数据存储与监控：如何将这些记录上传至远程管理平台以实现集中化管理。
实时日志：如何在用户界面上反馈实时推理结果，同时在后台记录日志。

通过结合Arthur回调处理器和LangChain的LLM构建能力，这些问题可以迎刃而解。Arthur提供了便捷的SDK和控制台界面，开发者可以轻松将模型推理历史上传至Arthur平台，并在仪表盘上进行可视化监控。

核心原理解析

回调处理器(Callback Handler)的作用是拦截并处理某些事件或数据流。具体而言，在LangChain中，我们可以配置回调处理器来捕获模型推理的输入和输出，以便将这些数据进行进一步处理或上传。例如，我们通过ArthurCallbackHandler实现以下目标：

捕获模型的输入消息和生成的响应。
将这些记录以结构化数据的形式上传至Arthur平台指定的模型实例。
支持与其他回调处理器（如流式输出到终端）共存。

此外，LangChain支持基于多回调接口的灵活组合，这为开发者自定义日志记录行为提供了极大自由。

代码实现演示

以下代码展示了如何配置Arthur的回调处理器并运行一个可交互的Chat型LLM应用。

1. 安装和配置

import openai
from langchain_community.callbacks import ArthurCallbackHandler
from langchain_core.callbacks import StreamingStdOutCallbackHandler
from langchain_core.messages import HumanMessage

最低0.47元/天解锁文章