A SURVEY OF SELF-EVOLVING AGENTS: ON PATH TO ARTIFICIAL SUPER INTELLIGENCE

在这里插入图片描述

文章主要内容总结

该论文是首篇关于自进化代理(self-evolving agents)的系统性综述,核心围绕“从静态大语言模型(LLMs)到自进化代理,最终迈向人工超级智能(ASI)”的范式转变展开,主要内容包括:

  1. 核心维度框架:提出自进化代理的三大基础维度,即“进化什么(what to evolve)”“何时进化(when to evolve)”“如何进化(how to evolve)”。

    • 进化什么:涵盖代理的四大组件,包括模型(参数与能力更新)、上下文(记忆进化与提示词优化)、工具(工具的创建、掌握与选择)、架构(单代理与多代理系统的优化)。
    • 何时进化:分为测试时内进化(intra-test-time,任务执行中实时适应)和测试时间进化(inter-test-time,任务完成后基于经验改进),并结合上下文学习(ICL)、监督微调(SFT)、强化学习(RL)等范式。
    • 如何进化:包括基于奖励的进化(文本反馈、内部置信度、外部奖励等)、模仿与示范学习(自生成示范、跨代理示范、混合示范)、基于群体的进化方法(单代理进化、多代理协同进化)。
  2. 评估与应用

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值