LangChain让LLM带上记忆

AGI大都

已于 2024-07-05 15:15:02 修改

阅读量322

点赞数 4

文章标签： langchain 人工智能数据库 llama

于 2024-06-27 11:56:13 首次发布

本文链接：https://blog.youkuaiyun.com/2401_85783301/article/details/140009925

版权

最近两年，我们见识了“百模大战”，领略到了大型语言模型（LLM）的风采，但它们也存在一个显著的缺陷：没有记忆。

在对话中，无法记住上下文的 LLM 常常会让用户感到困扰。本文探讨如何利用 LangChain，快速为 LLM 添加记忆能力，提升对话体验。

LangChain 是 LLM 应用开发领域的最大社区和最重要的框架。

1. LLM 固有缺陷，没有记忆

当前的 LLM 非常智能，在理解和生成自然语言方面表现优异，但是有一个显著的缺陷：没有记忆。

LLM 的本质是基于统计和概率来生成文本，对于每次请求，它们都将上下文视为独立事件。这意味着当你与 LLM 进行对话时，它不会记住你之前说过的话，这就导致了 LLM 有时表现得不够智能。

这种“无记忆”属性使得 LLM 无法在长期对话中有效跟踪上下文，也无法积累历史信息。比如，当你在聊天过程中提到一个人名，后续再次提及该人时，LLM 可能会忘记你之前的描述。

本着发现问题解决问题的原则，既然没有记忆，那就给 LLM 装上记忆吧。

2. 记忆组件的原理

2.1. 没有记忆的烦恼

当我们与 LLM 聊天时，它们无法记住上下文信息，比如下图的示例：

2.2. 原理

如果将已有信息放入到 memory 中，每次跟 LLM 对话时，把已有的信息丢给 LLM，那么 LLM 就能够正确回答，见如下示例：

目前业内解决 LLM 记忆问题就是采用了类似上图的方案，即：将每次的对话记录再次丢入到 Prompt 里，这样 LLM 每次对话时，就拥有了之前的历史对话信息。

但如果每次对话，都需要自己手动将本次对话信息继续加入到history信息中，那未免太繁琐。有没有轻松一些的方式呢？有，LangChain！LangChain 对记忆组件做了高度封装，开箱即用。

2.3. 长期记忆和短期记忆

在解决 LLM 的记忆问题时，有两种记忆方案，长期记忆和短期记忆。

短期记忆：基于内存的存储，容量有限，用于存储临时对话内容。
长期记忆：基于硬盘或者外部数据库等方式，容量较大，用于存储需要持久的信息。

3. LangChain 让 LLM 记住上下文

LangChain 提供了灵活的内存组件工具来帮助开发者为 LLM 添加记忆能力。

3.1. 单独用 ConversationBufferMemory 做短期记忆

Langchain 提供了 ConversationBufferMemory 类，可以用来存储和管理对话。

ConversationBufferMemory 包含input变量和output变量，input代表人类输入，output代表 AI 输出。

每次往ConversationBufferMemory组件里存入对话信息时，都会存储到history的变量里。

3.2. 利用 MessagesPlaceholder 手动添加 history

python复制代码from langchain.memory import ConversationBufferMemory

memory = ConversationBufferMemory(return_messages=True)
memory.load_memory_variables({
   })

memory

最低0.47元/天解锁文章