引言
本文主要介绍了智能体的六种设计模式,并基于ai studio平台搭建了对应的工作流示例。最后重点介绍了ReAct Agent以及针对ReAct框架延伸出来的一些变种架构。
本文部分图片来源以及内容描述参考网页:https://www.anthropic.com/engineering/building-effective-agents
Chain(链式处理)
模式描述
将复杂任务拆解为多个串联的子任务,通过多次调用大模型逐步完成。每个步骤的输出会作为下一个步骤的输入。
技术优势
- 分步思考提升处理质量
- 增强流程的可控性和灵活性
- 降低信息过载风险,避免一次性处理过多任务
工作流搭建
案例说明:日常写作中,我们通常分为三个步骤,1. 列出文章大纲;2. 内容书写;3. 全文检查润色。已知这三个步骤,我们可以构造三个大模型,依次按照我们给的指令执行内容生成。
Parallelization(并行处理)
模式描述
将任务拆解为多个可并行执行的子任务,同时处理后再合并结果。
技术优势
- 大幅提升处理效率
- 适用于子任务间耦合度低的场景
- 充分利用计算资源
工作流搭建
案例说明:代码审查系统:代码提交 → 多角度漏洞检测 → 风险汇总
Routing(路由分发)
模式描述
根据输入内容的特征或条件,动态地将任务分配给最合适的子任务或模型的一种工作流模式。强调智能决策和灵活调度,适用于多样化输入和多策略处理的场景。
- router大模型的作用是分类,最终产生一个routerKey作为后续走哪个分支的判断。(类似工作流中的意图识别节点)
- 走到对应的分支后会利用分支预先填好的提示词和prompt调用具体的分支模型。
技术优势
- 智能决策最优处理路径
- 灵活应对多样化输入
- 资源优化分配
工作流搭建
案例说明:
电商聊天机器人,当用户输入查询时,系统会先判断用户的意图类型:
- 商品搜索(如“我想买红色连衣裙”)
- 比价咨询(如“iPhone 15 和 小米14 哪个更值得买?”)
- 风格推荐(如“适合圆脸的太阳镜有哪些?”)
然后根据分类结果,将问题交给不同 Prompt 设计的子模型去处理,以提供更精准的回答。
Evaluator-Optimizer(评估优化)
模式描述
一个模型生成内容,另一个模型评估并提供优化反馈,多轮迭代提升质量。
技术优势
- 持续优化输出质量
- 生成-评估闭环
- 减少人工干预成本
工作流搭建
案例1说明:旅行计划制定:用户给定旅行天数和地点,以及一些其他要求。通过Evaluator-Optimizer模式迭代优化行程细节与预算分配。
案例2说明:辩论
Orchestrator-Workers(协调器-工作者)
模式描述
- 由一个大模型作为管理员对复杂任务进行拆分
- 拆分成子任务以及任务说明,再分发给其他大模型进行下一步执行
- 适合于无法在事前确定子任务个数
和Parallelization设计模式很类似,只是Parallelization是人工事先拆解好子任务交由大模型处理。而Orchestrator-Workers事先无法确定子任务个数。
技术优势
- 动态任务分解
- 灵活适应复杂场景
- 自动化程度高
工作流搭建
案例说明:输入一个需要分析的问题,模型会自动拆分成多个视角进行问题分析。
ReAct Agent
模式描述
模型自主规划、执行并根据环境反馈调整策略。
- 开放性问题:无法事先定义工作流
- 大模型自行规划执行条件和步骤
- 根据外部反馈进行下一步行动
ReAct Agent框架深度解析:原理、演进与前沿应用
ReAct(Reasoning and Acting)作为当前最受关注的AI Agent设计范式之一,通过将推理与行动有机结合,大幅提升了大型语言模型(LLM)处理复杂任务的能力。
ReAct框架的核心原理与架构设计
ReAct框架的革命性突破在于将人类解决问题的"三思而后行"思维过程形式化为可计算的模型架构。传统语言模型要么仅进行封闭推理(如Chain-of-Thought,CoT),要么盲目执行动作(如Action-only),而ReAct通过显式分离又动态耦合推理与行动两个模块,实现了1+1>2的效果。
核心循环机制
ReAct的基本工作单元是"思考-行动-观察"(TAO)循环:
-
-
思考(Thought)
- 模型分析当前状态,规划下一步行动策略
-
-
行动(Action)
- 根据思考结果调用外部工具或API
-
-
观察(Observation)
- 获取行动结果并更新上下文
这个循环会迭代执行直到任务完成,每个步骤都会生成结构化记录,形成完整的可解释轨迹。
ReAct扩展/变种架构模式
原始ReAct已衍生出多种增强变体,形成丰富的技术生态。
Reflexion模式
核心创新:在TAO循环中增加自我反思步骤,分析错误并调整策略。
两个大模型的协作过程为:
- Generate模型收到用户请求后,生成初始response,并交给Reflect模型
- Reflect模型给出评估后,将评语等反馈给Generate模型
- Generate模型根据评估做调整后,重新生成response
- 反复循环,直到达到用户设定的循环次数后,将最终response返回给用户。
Reflexion模式融合了ReAct和Evaluator-Opitimizer的核心思想,继承了ReAct交互式任务分解能力,借鉴了生成-评估循环思想。
优势:
- 错误修正能力提升30%以上(AlfWorld实验数据)
- 支持长期任务中的策略优化
PreAct框架
论文:PreAct: Prediction Enhances Agent’s Planning Ability
核心创新:在行动前增加预测步骤,形成"预测-执行-验证"循环。
PreAct 会在每一步中要求 LLM 生成对未来观察的预测和相应的应对措施 ,并根据预测观察与实际观测之间的差异提示 LLM 反思或改变其计划方向。
优势:
- 前瞻性规划减少无效操作
- 复杂任务成功率比原始ReAct提高20%
ActRe机制
论文:ReAct Meets ActRe: Autonomous Annotations of Agent Trajectories for Contrastive Self-Training
核心创新:逆向流程——先行动后生成解释,专为自动化数据标注设计。
A3T框架通过引入一个名为ActRe的提示代理来自动化训练语言代理这一过程。
优势:
- 降低人工标注成本
- 适用于需要大量训练数据的场景
LATS架构
论文:Language Agent Tree Search Unifies Reasoning Acting and Planning in Language Models
核心创新:
- 树搜索算法:LATS 使用蒙特卡罗树搜索(MCTS)算法,通过平衡探索和利用,找到最优决策路径。
- LM 驱动的值函数:利用预训练的语言模型评估状态并生成反馈,指导搜索过程。
- 环境反馈:通过与外部环境交互获取反馈,增强模型的适应性和问题解决能力。
优势:
- 在持续任务中实现收益最大化
- 支持多目标权衡(如转化率与用户体验)
多模态ReAct
核心创新:支持图像/视频等非文本输入和工具调用。
优势:
- 处理图文混合任务(如商品图文匹配)
- 调用CV工具增强能力
应用场景:
- 视觉搜索(上传图片找同款)
- 商品主图质量审核
- AR试妆效果生成
模式演进趋势总结
- 从静态到动态:Chain/Parallelization(固定流程)→Routing/Orchestrator(动态调度)。
- 从单机到协同:单一模型(Chain)→多模型协作(Evaluator-Optimizer/Orchestrator-Workers)。
- 从封闭到开放:预设任务(Chain)→自主规划(ReAct)。
如何学习AI大模型 ?
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。【保证100%免费】🆓
优快云粉丝独家福利
这份完整版的 AI 大模型学习资料已经上传优快云,朋友们如果需要可以扫描下方二维码&点击下方优快云官方认证链接免费领取 【保证100%免费】
读者福利: 👉👉优快云大礼包:《最新AI大模型学习资源包》免费分享 👈👈
对于0基础小白入门:
如果你是零基础小白,想快速入门大模型是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。
👉1.大模型入门学习思维导图👈
要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。
对于从来没有接触过AI大模型的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。(全套教程文末领取哈)
👉2.AGI大模型配套视频👈
很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,每个章节都是当前板块的精华浓缩。
👉3.大模型实际应用报告合集👈
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(全套教程文末领取哈)
👉4.大模型实战项目&项目源码👈
光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战项目来学习。(全套教程文末领取哈)
👉5.大模型经典学习电子书👈
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。(全套教程文末领取哈)
👉6.大模型面试题&答案👈
截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道,我总结了大模型常考的面试题。(全套教程文末领取哈)
为什么分享这些资料?
只要你是真心想学AI大模型,我这份资料就可以无偿分享给你学习,我国在这方面的相关人才比较紧缺,大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!
这些资料真的有用吗?
这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。
资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。
优快云粉丝独家福利
这份完整版的 AI 大模型学习资料已经上传优快云,朋友们如果需要可以扫描下方二维码&点击下方优快云官方认证链接免费领取 【保证100%免费】
读者福利: 👉👉优快云大礼包:《最新AI大模型学习资源包》免费分享 👈👈