在构建智能体(Agentic)应用时,上下文是决定模型响应质量的关键因素。各类智能体框架(如 LangGraph、CrewAI 等)的核心作用,本质上是构建包含充足上下文的增强型提示词(Prompt),帮助模型生成贴合需求的结果。而记忆系统作为上下文的重要来源,能让智能体记住交互历史、用户偏好等关键信息,大幅提升应用的个性化与连续性。AWS 推出的 AgentCore Memory 服务,正是为智能体应用提供短长期记忆管理的核心工具,本文将详细介绍如何借助它为智能体赋予“记忆能力”。

智能体记忆的核心分类:短期与长期
在智能体应用的语境中,记忆系统普遍分为短期记忆与长期记忆两类,二者各司其职,共同为增强型提示词提供上下文支撑:
- 短期记忆
:聚焦当前会话或任务周期内的信息,比如用户当前的提问内容、智能体的即时响应、多步骤任务的中间状态等。它的核心作用是保证单次交互的连贯性,例如在客服对话中,记住用户刚提到的“产品型号”或“问题症状”。
- 长期记忆
:则负责跨会话、跨周期的信息存储,其分类可参考 LangMem 指南的定义,具体包括三类关键记忆:
- 语义记忆(Semantic Memory)
:存储支撑智能体响应的事实与知识,比如用户的长期偏好(如“偏好中文界面”“对折扣敏感”)、领域特定信息(如某产品的保修政策)、交互历史摘要(如“用户上月曾咨询过账户登录问题”)。
- 情景记忆(Episodic Memory)
:记录成功的交互案例作为学习样本,不仅包含“发生了什么”(如用户投诉物流延迟),还包括“如何解决”(如智能体触发物流查询工具并承诺补偿)以及“为何有效”(如及时反馈安抚了用户情绪),帮助智能体复用有效策略。
- 过程记忆(Procedural Memory)
:定义智能体的行为规则与响应模式,例如“当用户提及退款时,需先验证订单状态”,这类记忆会动态补充到系统提示词中,约束智能体的行为边界。
- 语义记忆(Semantic Memory)
AgentCore Memory:AWS 智能体记忆服务的核心逻辑
AgentCore Memory 是 AWS 专为智能体应用设计的记忆管理服务,完美契合上述“短长期记忆”框架,同时提供灵活的策略配置与 API 交互能力,让记忆集成更高效。
1. 核心层级:短期记忆与长期记忆的协同
AgentCore Memory 的运作围绕“记忆资源(Memory Resource)”展开,每个记忆资源相当于一个“记忆容器”,可同时存储多个用户、多个会话的短长期记忆。其两层记忆系统的分工与流转逻辑如下:
- 短期记忆
:用于存储即时会话数据,每一次用户提问、智能体响应都会以“事件(E

最低0.47元/天 解锁文章
4242

被折叠的 条评论
为什么被折叠?



