智能体进阶——Plan-and-Solve模式

在这里插入图片描述
大家好,欢迎阅读这份《智能体(AI+Agent)开发指南》!
在大模型和智能体快速发展的今天,很多朋友希望学习如何从零开始搭建一个属于自己的智能体。本教程的特点是 完全基于国产大模型与火山推理引擎实现,不用翻墙即可上手,非常适合国内开发者快速实践。
通过循序渐进的讲解,你将学会从 环境配置、基础构建、进阶功能到实际案例 的完整流程,逐步掌握智能体开发的核心技能。无论你是初学者还是有经验的工程师,相信这份教程都能为你带来启发。

一. Decomposition-First 方法

显式任务分解
▪ 在任务开始时,优先将复杂任务拆解为多个子任务或步骤。
▪ 这种分解通常由大模型(LLM)主导,强调结构化、逻辑化的分解过程。
规划优先于执行
▪ 分解之后,先规划完成路径或执行步骤,再按照规划逐步执行,避免临时性、随意性推理。
▪ 强调“先想清楚,再动手做”。
子任务形式结构化
▪ 任务分解时通过结构化方式表达子任务或计划,便于后续处理与执行。
执行依赖明确
▪ 在分解过程中,明确子任务之间的依赖关系或执行顺序,保障整体任务逻辑一致性与执行效率。

二. Reasoning without Observation

背景:每一步都Observation,浪费token
现有的增强型语言模型(ALMs)通过交替地调用外部工具并获取反馈来进行推理,“想–查–想–查”穿插执行,但这种方式会因重复提示和多次执行而导致计算复杂度过高。
核心思路:先“想”再统一“查”——分离思考与观察
◦ ReWOO 将思考过程和下载工具结果分离,不再每一步思考后立即中断去 “查”。
◦ 模型先连续生成完整思考流程(无工具调用),然后一次性执行所有工具,最后统一获取观察结果,这样减少了中间跳转和 prompt 重复,显著提升 token 使用效率。
◦ Planner包含连续的元组(Plan,#E),其中#Es(s表示步骤编号)是一个特殊的占位符或标记,它用来存储在执行第s步时,从相应的 Worker(执行子任务的组件)那里获得的、被认为是正确的证据(evidence)。

在这里插入图片描述

ReO与ReWOO对比

Planner(规划器):用大语言模型(LLM)的推理能力,先生成一份“方案蓝图”,包含每一步的描述信息Plan,以及一个特殊变量#E,用来存储执行证据。
▪ 例如:Plan = “先搜索证据”,#E1 = “搜索结果”
Worker(执行器):根据 Planner 的指令,与外部环境或工具交互,并把真实的观测/结果写入 #E。
Solver(解算器):最后读取所有的 Plan + #E,生成最终答案或者动作的执行状态。
▪ 并且提示 Solver“谨慎”使用这些信息,可以让模型在 Planner 或 Worker 失败时,自己用推理能力弥补。

提示工程与AI智能体构建指南:https://huggingface.co/blog/VirtualOasis/ai-prompt-engineering-and-agents

欢迎关注微信公众号:AIWorkshopLab,自动获取完整教程:智能体(AI+Agent)开发指南.pdf。

提供了基于BP(Back Propagation)神经网络结合PID(比例-积分-微分)控制策略的Simulink仿真模型。该模型旨在实现对杨艺所著论文《基于S函数的BP神经网络PID控制器及Simulink仿真》中的理论进行实践验证。在Matlab 2016b环境下开发,经过测试,确保能够正常运行,适合学习和研究神经网络在控制系统中的应用。 特点 集成BP神经网络:模型中集成了BP神经网络用于提升PID控制器的性能,使之能更好地适应复杂控制环境。 PID控制优化:利用神经网络的自学习能力,对传统的PID控制算法进行了智能调整,提高控制精度和稳定性。 S函数应用:展示了如何在Simulink中通过S函数嵌入MATLAB代码,实现BP神经网络的定制化逻辑。 兼容性说明:虽然开发于Matlab 2016b,但理论上兼容后续版本,可能会需要调整少量配置以适配不同版本的Matlab。 使用指南 环境要求:确保你的电脑上安装有Matlab 2016b或更高版本。 模型加载: 下载本仓库到本地。 在Matlab中打开.slx文件。 运行仿真: 调整模型参数前,请先熟悉各模块功能和输入输出设置。 运行整个模型,观察控制效果。 参数调整: 用户可以自由调节神经网络的层数、节点数以及PID控制器的参数,探索不同的控制性能。 学习和修改: 通过阅读模型中的注释和查阅相关文献,加深对BP神经网络与PID控制结合的理解。 如需修改S函数内的MATLAB代码,建议有一定的MATLAB编程基础。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

CV-deeplearning

请博主加个火腿

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值