[优化对话长度：利用Langchain进行智能消息修剪]

最新推荐文章于 2025-12-05 17:57:22 发布

原创

最新推荐文章于 2025-12-05 17:57:22 发布 · 1.5k 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#langchain #服务器 #人工智能 #python

# 优化对话长度：利用Langchain进行智能消息修剪

在使用大型语言模型进行对话生成时，维护和优化消息长度是一个重要的环节。本篇文章将深入探讨如何使用Langchain提供的`trim_messages`工具来管理对话历史的长度，使其适应模型的上下文窗口限制。

## 引言

在与语言模型进行交互时，所有模型都有其能处理的最大上下文窗口。过长的对话历史可能导致消息被截断或无响应。因此，开发者需要对消息进行有效的修剪。`trim_messages`工具能帮助开发者根据设定的最大token数，采用不同的策略修剪消息列表。

## 主要内容

### 1. 修剪策略

`trim_messages`工具提供了多种策略包括获取消息列表中的最后`max_tokens`个token或第一个`max_tokens`个token。选择适合的策略有助于保持重要信息：

- **获取最后的`max_tokens`个token**：将策略设为`"last"`，帮助保留最新的对话内容。
- **获取第一个`max_tokens`个token**：将策略设为`"first"`，保留对话的开头部分。

### 2. 使用API代理服务

由于某些地区的网络限制，开发者在使用API时可能需要考虑使用API代理服务以确保稳定的访问。这里示例的API端点使用 `{AI_URL}`。

## 代码示例

以下是一个使用`trim_messages`的Python代码示例，展示如何修剪消息列表以保留最后的45个token：

```python
# pip install -U langchain-openai
from langchain_core.messages import (
    AIMessage,
    HumanMessage,
    SystemMessage,
    trim_messages,
)
from langchain_openai import ChatOpenAI

messages = [
    SystemMessage("you're a good assistant, you always respond with a joke."),
    HumanMe

最低0.47元/天解锁文章