传统LLM Agent工作流固化,难以应对动态环境。本文提出"Self-Evolving AI Agents"新范式,让智能体像生物一样在与环境交互中自主优化结构,实现终身学习。文章介绍自演化三定律(安全稳定、性能提升、自主优化),提出统一框架(系统输入、智能体系统、环境反馈、优化器),并详细阐述单智能体、多智能体及垂直领域的演化方法,为构建能持续进化的AI系统提供全面指导。
传统 LLM Agent 的工作流一旦部署,提示词、工具、记忆、协作拓扑全部固化。面对动态环境(新 API、新法规、新用户意图),只能人工硬编码——成本高、迭代慢、不可持续。

智能体演化与优化技术分三大方向: 单智能体优化、多智能体优化和领域专用优化

这篇 55 页综述首次系统提出 “Self-Evolving AI Agents” 新范式:
让 Agent 像生物一样,在与环境的持续交互中自主优化自身结构,实现终身学习(Lifelong Learning)。

图 1 演化四阶段
图 1:从离线预训练(MOP)到多智能体自演化(MASE)的 4 阶段演进

四种以LLM为核心的学习范式对比
三定律:自演化 Agent
借鉴阿西莫夫三定律,提出 Self-Evolving 三定律:

| 定律 | 内容 | 优先级 |
|---|---|---|
| Endure | 任何修改不得破坏安全与稳定 | 最高 |
| Excel | 在确保安全的前提下,性能只能升不能降 | 次高 |
| Evolve | 满足前两条时,必须能自主优化内部组件 | 最低 |
三定律被形式化进优化目标函数,作为硬约束贯穿整篇综述。
统一框架:把“演化”抽象成四大模块
给出一张“万能闭环图”,任何自演化系统都可拆成 4 个可插拔模块:

图 3 概念框架
图 3:系统输入 → 智能体系统 → 环境反馈 → 优化器 → 回到系统
| 模块 | 职责 | 示例 |
|---|---|---|
| System Inputs | 定义任务/数据/约束 | 金融问答、代码修复 |
| Agent System | 被优化的“本体” | LLM + 提示 + 记忆 + 工具 |
| Environment | 提供可量化反馈 | 单元测试结果、人类评分 |
| Optimiser | 搜索更好配置 | 贝叶斯优化、RL、进化算法 |

智能体自演化方法的完整层次化分类,涵盖单智能体、多智能体与领域专用优化三大类别
单智能体演化:从提示、记忆到工具

单智能体优化方法概览
1 提示词自己写自己:Prompt Optimisation
- Edit-Based:GRIPS 做短语级增删改
- Generative:OPRO 让 LLM 一次性生成全新提示
- Text-Gradient:TextGrad 把“自然语言批评”当成梯度
- Evolutionary:PromptBreeder 维持一个“提示种群”不断变异
2 记忆不再“金鱼”:Memory Optimisation
| 短程记忆 | 长程记忆 |
|---|---|
| 递归摘要、动态过滤 | 外挂向量库、知识图谱、遗忘曲线 |
代表工作:MemGPT、HippoRAG、A-MEM、MemoryBank
3 工具“自生”:Tool Optimisation
- Training-Based:ToolLLM、Confucius、ReTool(用 RL 学调用)
- Inference-Time:EASYTOOL 把 100+ API 文档压缩成 1 句人话
- Tool Creation:CREATOR、LATM、Alita——直接让 Agent 写代码造新工具
多智能体演化: topology 也能“长”出来
手工设计协作流程太贵,于是:

图 6 多智能体优化全景
图 6:多智能体工作流搜索空间 vs 优化算法 vs 目标(准/快/省/安全)
| 演化维度 | 做法 | 代表 |
|---|---|---|
| Prompt 级 | 多 Agent 提示一起搜 | DSPy、AutoAgents |
| Topology 级 | 把“谁跟谁说话”变成可微边 | GPTSwarm、DynaSwarm、G-Designer |
| 统一联合 | 提示 + 拓扑 + 工具同时搜 | ADAS、EvoFlow、MAS-ZERO |
| Backbone 级 | 用对抗轨迹继续 SFT/RL | MaPoRL、OPTIMA、Sirius |
垂直领域演化
| 领域 | 关键约束 | 演化技巧 |
|---|---|---|
| 医疗诊断 | 法规、多模态、不确定性 | 多 Agent 模拟会诊、症状树动态更新 |
| 分子发现 | 化学符号合法性 | 接入 RDKit、失败反应写进记忆 |
| 代码生成 | 单元测试即奖励 | Self-Edit、PyCapsule、OpenHands |
| 金融投研 | 实时性、合规 | 情绪 Agent + 检索 Agent + 风控 Agent 联合演化 |
https://arxiv.org/pdf/2508.07407
可能大家都想学习AI大模型技术,也_想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习_,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。
为了帮助大家打破壁垒,快速了解大模型核心技术原理,学习相关大模型技术。从原理出发真正入局大模型。在这里我和MoPaaS魔泊云联合梳理打造了系统大模型学习脉络,这份 LLM大模型资料 分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码免费领取🆓**⬇️⬇️⬇️

【大模型全套视频教程】
教程从当下的市场现状和趋势出发,分析各个岗位人才需求,带你充分了解自身情况,get 到适合自己的 AI 大模型入门学习路线。
从基础的 prompt 工程入手,逐步深入到 Agents,其中更是详细介绍了 LLM 最重要的编程框架 LangChain。最后把微调与预训练进行了对比介绍与分析。
同时课程详细介绍了AI大模型技能图谱知识树,规划属于你自己的大模型学习路线,并且专门提前收集了大家对大模型常见的疑问,集中解答所有疑惑!

深耕 AI 领域技术专家带你快速入门大模型
跟着行业技术专家免费学习的机会非常难得,相信跟着学习下来能够对大模型有更加深刻的认知和理解,也能真正利用起大模型,从而“弯道超车”,实现职业跃迁!

【精选AI大模型权威PDF书籍/教程】
精心筛选的经典与前沿并重的电子书和教程合集,包含《深度学习》等一百多本书籍和讲义精要等材料。绝对是深入理解理论、夯实基础的不二之选。

【AI 大模型面试题 】
除了 AI 入门课程,我还给大家准备了非常全面的**「AI 大模型面试题」,**包括字节、腾讯等一线大厂的 AI 岗面经分享、LLMs、Transformer、RAG 面试真题等,帮你在面试大模型工作中更快一步。
【大厂 AI 岗位面经分享(92份)】

【AI 大模型面试真题(102 道)】

【LLMs 面试真题(97 道)】

【640套 AI 大模型行业研究报告】

【AI大模型完整版学习路线图(2025版)】
明确学习方向,2025年 AI 要学什么,这一张图就够了!

👇👇点击下方卡片链接免费领取全部内容👇👇

抓住AI浪潮,重塑职业未来!
科技行业正处于深刻变革之中。英特尔等巨头近期进行结构性调整,缩减部分传统岗位,同时AI相关技术岗位(尤其是大模型方向)需求激增,已成为不争的事实。具备相关技能的人才在就业市场上正变得炙手可热。
行业趋势洞察:
- 转型加速: 传统IT岗位面临转型压力,拥抱AI技术成为关键。
- 人才争夺战: 拥有3-5年经验、扎实AI技术功底和真实项目经验的工程师,在头部大厂及明星AI企业中的薪资竞争力显著提升(部分核心岗位可达较高水平)。
- 门槛提高: “具备AI项目实操经验”正迅速成为简历筛选的重要标准,预计未来1-2年将成为普遍门槛。
与其观望,不如行动!
面对变革,主动学习、提升技能才是应对之道。掌握AI大模型核心原理、主流应用技术与项目实战经验,是抓住时代机遇、实现职业跃迁的关键一步。

01 为什么分享这份学习资料?
当前,我国在AI大模型领域的高质量人才供给仍显不足,行业亟需更多有志于此的专业力量加入。
因此,我们决定将这份精心整理的AI大模型学习资料,无偿分享给每一位真心渴望进入这个领域、愿意投入学习的伙伴!
我们希望能为你的学习之路提供一份助力。如果在学习过程中遇到技术问题,也欢迎交流探讨,我们乐于分享所知。
*02 这份资料的价值在哪里?*
专业背书,系统构建:
-
本资料由我与MoPaaS魔泊云的鲁为民博士共同整理。鲁博士拥有清华大学学士和美国加州理工学院博士学位,在人工智能领域造诣深厚:
-
- 在IEEE Transactions等顶级学术期刊及国际会议发表论文超过50篇。
- 拥有多项中美发明专利。
- 荣获吴文俊人工智能科学技术奖(中国人工智能领域重要奖项)。
-
目前,我有幸与鲁博士共同进行人工智能相关研究。

内容实用,循序渐进:
-
资料体系化覆盖了从基础概念入门到核心技术进阶的知识点。
-
包含丰富的视频教程与实战项目案例,强调动手实践能力。
-
无论你是初探AI领域的新手,还是已有一定技术基础希望深入大模型的学习者,这份资料都能为你提供系统性的学习路径和宝贵的实践参考,助力你提升技术能力,向大模型相关岗位转型发展。



抓住机遇,开启你的AI学习之旅!

5439

被折叠的 条评论
为什么被折叠?



