周四晚8点!一起来聊聊Agent Memory的实现路径

部署运行你感兴趣的模型镜像

原文:https://mp.weixin.qq.com/s/3tsruIuIaKOaQ2GhqywEuw

为了突破现有Agent记忆机制的瓶颈,新加坡国立大学的研究团队最新提出了MemGen框架。

论文:MemGen: Weaving Generative Latent Memory for Self-Evolving Agents
链接:https://arxiv.org/abs/2509.24704
代码:https://github.com/KANABOON1/MemGen

该框架引入了一种动态的、生成式的隐式记忆(Latent Memory)机制。MemGen的核心由记忆触发器(Memory Trigger)与记忆编织器(Memory Weaver)构成,二者协同作用,在推理时按需生成并整合与当前认知状态高度相关的隐式记忆。

在不对主模型进行任何任何微调的前提下,MemGen只将外部知识注入到外部记忆模块,并在解码时动态注入,所实现的性能最高超过全参数量微调的GRPO高达13.4%。

更多解读请阅读:最新成果!Agent记忆的第三种可能:生成式隐式记忆

10月16日(周四)晚8点,青稞Talk 第81期,新加坡国立大学博士生张桂彬,将直播分享最新成果《MemGen:生成式隐式记忆,Agent Memory 的第三种可能》。

分享嘉宾

张桂彬是新加坡国立大学计算学院博士研究生,导师为颜水成教授,研究方向为Multi-Agent System,Agent Memory和Self-Evolving Agent,目前在NeurIPS、ICML、ICLR、KDD、TKDE等顶级会议/期刊发表论文十余篇。

他发表了Graph for Agent系列工作,包括G-Designer【ICML 2025 Oral】,G-Safeguard【ACL 2025】,以及G-Memory。其他工作如MaAS【ICML 2025 Oral】,AgentPrune【ICLR 2025】也受到关注。

主题提纲

MemGen:生成式隐式记忆,Agent Memory 的第三种可能

1、什么是 Agent Memory
2、现有 Agent Memory 范式的实现路径及局限
3、第三种可能:动态、生成式的记忆框架 MemGen
4、MemGen 的评估及 Agent Memory 未来探讨

直播时间

10月16日20:00 - 21:00

如何观看

Talk 将在青稞社区【视频号:青稞AI、Bilibili:青稞AI】上进行,欢迎预约!

同时,嘉宾已经入驻青稞社区·知识星球,想要提问交流的朋友可以加入星球!

您可能感兴趣的与本文相关的镜像

Llama Factory

Llama Factory

模型微调
LLama-Factory

LLaMA Factory 是一个简单易用且高效的大型语言模型(Large Language Model)训练与微调平台。通过 LLaMA Factory,可以在无需编写任何代码的前提下,在本地完成上百种预训练模型的微调

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值