
文章主要内容总结
该论文是首篇关于自进化代理(self-evolving agents)的系统性综述,核心围绕“从静态大语言模型(LLMs)到自进化代理,最终迈向人工超级智能(ASI)”的范式转变展开,主要内容包括:
-
核心维度框架:提出自进化代理的三大基础维度,即“进化什么(what to evolve)”“何时进化(when to evolve)”“如何进化(how to evolve)”。
- 进化什么:涵盖代理的四大组件,包括模型(参数与能力更新)、上下文(记忆进化与提示词优化)、工具(工具的创建、掌握与选择)、架构(单代理与多代理系统的优化)。
- 何时进化:分为测试时内进化(intra-test-time,任务执行中实时适应)和测试时间进化(inter-test-time,任务完成后基于经验改进),并结合上下文学习(ICL)、监督微调(SFT)、强化学习(RL)等范式。
- 如何进化:包括基于奖励的进化(文本反馈、内部置信度、外部奖励等)、模仿与示范学习(自生成示范、跨代理示范、混合示范)、基于群体的进化方法(单代理进化、多代理协同进化)。
-
评估与应用:

订阅专栏 解锁全文
1655

被折叠的 条评论
为什么被折叠?



