论文阅读_3_大模型记忆反思_《From LLM to Conversational Agent: A Memory Enhanced Architecturewith Fine-Tuning o》

本文介绍了一种新的AI框架RAISE,通过集成长期和短期记忆系统,增强了ReAct在复杂对话任务中的控制力和适应性。实验使用贝壳房地产数据集,评估了RAISE在处理对话策略和利用LLMs的能力。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

0-摘要

提出RAISE( Reasoning and Acting through Scratchpad and Examples)框架,加强版的ReAct,增加一个双重(长+短记忆)的记忆组件。表明这种框架在复杂的多轮任务中,能够提高Agent的控制能力和适应能力。

1-引言

在大模型领域的一个大的挑战是把大模型集成对话式的Agent。亟需一个更复杂的框架来利用LLM在解决其在会话环境中的局限性。本文提出RAISE,是一个加强版的ReAct框架。RAISE的主要创新在于给 ReAct增加一个双重的记忆系统,分别为长期记忆和短期记忆。便签组件的功能是作为临时存储器,捕获以及处理来自最近互动的关键信息和结论,类似于短期记忆。同时检索模块,从历史中检所和当前对话上下文相关的例子,作为长期记忆。RAISE构建了一个全面,复杂的Agent场景,从头开始构建一个AGENT,以确保真实世界交互中的真实性和相关性。

实验评估用的数据集是:房地产销售的专门内部数据集(贝壳自己的数据集)

2-方法

(1)对话模块

接受用户输入,给用户输出Agent处理好的回答

(2)LLMs

agent 的大脑🧠,负责感知,根据具体任务做出计划,Tool选择,总结等等。既可以直接用Prompt工程,也可以用微调来获得。

(3)记忆模块

记忆模块帮助RAISE存储从环境中获得信息,帮助Agent做下一步的决策。记忆有以下组件构成:

  • System Prompt(系统级别Prompt) :包括profile(身份定义,对象,行为等等),任务指引,工具描述,few-shot examples, system prompt 可以是静态的,也可以是动态的
  • Context(上下文):包括对话上下文,任务轨迹
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值