糟糕,我的 AI 玩具又犯“失忆症”了!

在 AI 玩具飞速发展的当下,陪伴类玩具正在经历从能对话向懂人心的进阶。而懂人心的核心在于:理解当下与过往记忆的融合,提供有温度、个性化的陪伴服务。

因此,网易云信的情感陪伴智能体记忆框架结合自研实时对话智能体引擎,通过多层次记忆系统、智能记忆管理与混合存储架构,让智能体真正做到记住用户、理解用户,实现从单次交互到长期陪伴的跨越。

当前,GPT-4、Claude和LLaMA等大型语言模型(LLMs)在自然语言处理领域已经展现出了卓越的能力,但在实际应用中却普遍面临一个核心挑战:上下文长度的限制导致其难以实现真正的长期记忆

其原因在于Transformer架构中,注意力机制的计算复杂度随序列长度呈二次方增长,其灾难性遗忘(Catastrophic Forgetting)现象在模型微调过程中尤为突出,此外,对话信息会因注意力权重的稀释而逐渐丢失。

而以上因素的叠加,最明显的问题会导致随着对话轮次的叠加, AI 难以记住先前的对话内容,从而表现出“失忆症”的症状。

例如,AI 可能会忘记用户偏好、重复提问,甚至在不同会话中前后矛盾,这严重损害了用户体验,并削弱了用户对 AI 的信任。

例如,用户在一个会话中,明确提到自己在健身,希望能够减重增肌,但在后续会话中,缺乏持久记忆的AI系统,为了迎合用户,可能会推荐烧烤、炸鸡的饮食方式,完全违背用户自己建立的偏好。

记忆系统的整体设计

在设计情感陪伴智能体之初,网易云信锚定的 AI 智能体服务对象便是现实世界的每一个个体,这就需要让 AI 的记忆方式更贴合人类的记忆方式

因此,在情感陪伴智能体记忆框架设计方面,网易云信根据时间维度,将记忆分长期、中期、短期三个阶段,使用不同的方式对记忆进行抽取、存储和召回。

进而,让 AI 智能体具有更完善、更丰富、更立体的记忆,使其能够更好地与用户互动,通过更加真实的体验。

短期记忆、中期记忆、长期记忆

短期记忆(STM):即从对话流中获取的即时、未处理、基于会话界别的信息,短期记忆存储用户当前的交互行为和对话内容。人类的短期记忆的保留时间大概是几秒到十几秒,对于 AI 最有价值的短期记忆是近 10~20 轮对话的内容。

中期记忆(MTM):即从对话信息流中抽取的有价值的重要事实、事件和关系,中期记忆是短期记忆延续阶段、长期记忆的初始阶段,需要不断地、反复地抽取、总结、更新,保留记忆中最重要,最有价值的部分。

长期记忆(LTM):是通过短期记忆、中期记忆不断、深度加工而形成的持久的、稳定的信息。保留了个体知识、经验、技能和自我认同等核心信息。

在具体应用上,三种记忆方式的使用需要根据用户的输入信息,综合考虑最近、相关、重要的记忆,通过上下文传递给大模型( LLMs),协助 AI 给出更好的响应内容。

例如:

·用户的query:

今天下午,小华请我去吃炸鸡,你看要去吗?

·记忆召回:

短期记忆:

用户(昨晚):工作了一天好累呀~~

AI(昨晚):可以做一些简单的锻炼,放松放松。然后冲个热水澡

用户(昨晚):嗯。坚持锻炼,保持身材

AI(昨晚):加油

中期记忆:

用户制定了一个健身计划,需要控制饮食

用户喜欢吃炸鸡

用户和小华是好友

长期记忆:

用户很注重朋友关系,很nice。容易从众。喜欢聚会

·期望AI的答复:

AI:要么拒绝掉呗。你最近在减少呢。昨天还说要保持身材哟。

AI:要么去吃呗。你们也很久没见面了。偶尔来一顿“欺骗餐”,也没关系。

AI:去吧~ 去吧~ 吃饱了,才有力气锻炼。

所以,开发者如果想自行进行情感陪伴智能体记忆框架的开发,不论是基于开源抑或闭源,都需要综合考虑效果指标和性能指标。

·效果指标:在事实回忆、情感洞察、情景理解、开放性问题、角色扮演等五个方面的问题,能够做出合理的响应;

·性能指标:在记忆抽取、召回,响应时间、token消耗、吞吐量等指标,能符合业务要求。

记忆体的技术架构

从当大模型(LLMs)的发展和应用来看,记忆系统可以说在近两年发展十分迅猛,开源项目和闭源项目层出不穷。

但本质上,每一个模型的设计也各有侧重,网易云信情感陪伴智能体记忆框架是基于多种类型记忆框架结合自研后的一个产物。

具体而言,网易云信情感陪伴智能体记忆框架对市面上各类开源和闭源进行了大量的筛选,并比对 github 的 star 数量,重现项目的 benchmark,了解项目的实现思路等,最终选定了三个开源项目:mem0、memobase、memoryOS,进行深入的评测和比较。

技术选型

MemoryOS、Mem0、Memobase的对比

如果开发者打算基于开源项目进行智能体记忆框架搭建,可以进行如下评估:使用 locomo数据集,对记忆体进行评分。

1)使用数据集,根据不同的方案,初始化记忆体;

2)使用问题集,对不用的记忆体,采用相同的 Prompt 和 LLM,获得问题的回复;

3)根据记忆体的问题回复和标准回复,计算 BLEU 分数,也可以让 LLM 再进行一轮推断,得到评估结果。

当然,网易云信情感陪伴智能体记忆框架整个评估流程尽管非常科学,但标准的 locomo 数据集依然会有场景上的局限性。

所以,网易云信在对记忆框架选型和构建的过程中,重新积累了一套数据集的制作方案,会根据客户的特定场景,定制特定的数据集,对记忆体方案进行微调。

自研的架构

综合来看,网易云信基于开源系统和记忆产品的设计目标,通过自研的情感陪伴智能体记忆框架补齐了开源记忆项目的几处短板,并进行了架构层面的优化。

记忆体短板:

1.记忆体的具体实现,还在不断地演进。单一的开源方案,在对业务透明的前提下,不支持平滑的记忆体切换;

2.开源项目都自带一套默认记忆抽取 prompt,不能满足所有的业务场景;

3.记忆体的评估过程,使用了标准的 locomo 数据集,以及标准的评估方法,不能满足所有的业务场景。

在架构上优化:

1.形成业务层的架构体系,支持 STM、MTM、LTM 不同方案的组合实现,同时具备了记忆体的快速初始化能力;

2.实现了对开源系统的内置prompt的动态可配置化管理;

3.实现了记忆体评估闭环。

通过评估,最终采用自研的 LTM、STM,mem0 作为 MTM 的具体实现。

记忆与情感,深度陪伴的未来

当然,网易云信自研的情感陪伴智能体记忆框架并不是说就非常完美,会存在如:多次 LLM 调用、向量计算开销大等局限性,但随着技术的持续迭代,相信在不久的将来,这些问题都将被逐步优化。

比如通过记忆压缩算法减少冗余信息并降低 Token 成本,通过边缘计算将高频记忆存储在本地设备,提升响应速度等。

对于网易云信情感陪伴智能体而言,记忆框架的价值不仅在于记住信息,更在于理解情感,从而让记忆系统不仅存储事实,更能记录情绪关联,实现从记忆事实到记忆情感的跨越。

网易云信相信,未来的情感陪伴将更精准、更共情、更具温度,最终真正实现连接人与世界,传递情绪价值的终极目标。

参考文档

1.mem0:https://github.com/mem0ai/mem0

2.memobase:https://github.com/memodb-io/memobase

3.memoryOS:https://github.com/BAI-LAB/MemoryOS

4.locomo:https://github.com/snap-research/locomo

扫描下方二维码获取同款智能体试用~

关于我们

图片

免费下载干货资料

图片

图片

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值