一文搞懂 Planning 模式:从核心概念到工程落地的完整实践指南

部署运行你感兴趣的模型镜像

1、 什么是规划模式

规划模式让AI Agent在执行任何操作之前制定计划或解决方案。

Planning Agent不会像ReAct那样直接深入到逐步推理和工具使用中,而是会先为任务指定一个高级计划或路线图,之后Agent会去执行计划中的每一个步骤,最终给出答案。这种方式通过首先制定计划然后采取行动,增强了LLM代理处理复杂任务和决策的能力。

2、 为什么要规划

为什么我们需要为AI Agent设置明确的规划阶段?简而言之,有些问题过于复杂,如果没有全局战略,就无法一步一步解决。ReAct范式擅长被动决策。Agent会观察当前状态,决定一个动作并执行,然后观察结果并重复执行。

img

这对简单或高度不确定的任务非常有效,但对于受益于全局观的多步骤问题可能效果不好。Planning模式通过细分任务和概述目标,Agent可以获得对问题的整体看法,更具有战略性和更高的效率。

img

在这种情况下,ReAct Agent可能最终也能找到答案,但在过程中蜿蜒曲折或重复工作,因为每次它只能决定一个动作;而规划Agent会尝试提前确定所有必要的步骤,并且不太可能偏离目标。

img

规划是有效的,另一个原因是避免错过重要步骤,即使强制LLM逐步推理,也可能会跳过关键步骤或产生有缺陷的解决路径而出现幻觉。如果我们强调模型先制定计划再执行它,我们会迫使它思考整个解决方案路径,从而减少跳过步骤的机会。ReAct代理的设计使其每次只能规划一个动作,并且不一定会预见下一步之后的动作,可能导致复杂任务的执行轨迹不理想。

使用规划有效的情况:

  • 问题自然地分解为子任务或阶段
  • 不规划,Agent可能在许多步骤中忘记要求或背景。
  • 贪婪的循序渐进的方法可能会陷入困境或偏离轨道。
  • 希望Agent的解决方案路径是可解释和可验证的。

3、规划模式实际上如何运作

Agent会花一些时间提前思考,然后才逐一执行这些步骤。通过以这种方式构建Agent循环,可以获得更有条理、通常更高效的工作流程。

img

  • 首先,LLM规划师分析用户请求并生成子任务列表。
  • 单任务执行Agent按顺序处理每一个子任务,可能使用工具来完成。
  • 单步任务执行后,Agent会根据结果更新其状态。如果新信息需要,Agent会在继续执行之前重新规划。
  • 所有步骤完成后,Agent会像用户发出响应。这种关注点分离使得清晰的长期规划与迭代操作相结合成为可能。
3.1.规划阶段

Agent检查用户的查询或目标并制定高级计划,通常意味着将问题分解为子目标或子任务,可能会提示LLM输出解决问题所需的有序步骤列表。

img

此时,Agent正在创建路线图,尚未解决任何问题,它会在执行之前分析目标并决定策略,生成的计划可以是简单 的语言或结构化格式,只要后续步骤可以解释即可。

3.2. 执行阶段

一旦有了计划,Agent就会进入循环,迭代执行每个子任务。从计划中迈出第一步,执行并获取结果,然后进入下一步,以此类推。在执行过程中,Agent可能会根据每个子任务的需要调用外部工具或API,Agent始终将该计划作为下一步的行动指南,而不是从头开始构思新的行动,一直持续到所有计划的步骤都完成。

img

在次阶段,Agent会将结果或中间发现汇总到记忆或暂存器中,每次迭代都可以被认为Agent在计划的指导下专注于单个子问题。

3.3.聚合和响应

执行必要的步骤后,Agent会收集所有相关的输出并组成最终的答案或结果。由于Agent遵循了结构化计划,因此在此阶段可以直接汇总结果然后将最终响应呈现给用户。

img

规划模式的一个可选但重要的方面是反馈和迭代。与传统程序不同,AI Agent可以检测到某些事情没有按预期进行时进行调整。在执行过程中,如果子任务失败或产生意外结果,代理可以决定重新审视计划。

理想情况下,代理将按照修改后的计划继续执行。实际上,可以通过再次调用LLM规划师来实现,向其提供部分进度并请求更新后的计划。这确保了当情况发生变化时,Agent不会陷入糟糕的初始计划。

通过将Agent的工作流程构建为计划阶段和执行阶段,可以获得更好的组织性、清晰度,并且通常可以为复杂任务获得更好的结果。

那么,如何系统的去学习大模型LLM?

作为一名从业五年的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。

所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。

由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~
在这里插入图片描述

为什么要学习大模型?

我国在A大模型领域面临人才短缺,数量与质量均落后于发达国家。2023年,人才缺口已超百万,凸显培养不足。随着AI技术飞速发展,预计到2025年,这一缺口将急剧扩大至400万,严重制约我国AI产业的创新步伐。加强人才培养,优化教育体系,国际合作并进是破解困局、推动AI发展的关键。

在这里插入图片描述

在这里插入图片描述

👉大模型学习指南+路线汇总👈

我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。
在这里插入图片描述
在这里插入图片描述

👉①.基础篇👈

基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。
在这里插入图片描述

👉②.进阶篇👈

接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。
在这里插入图片描述

👉③.实战篇👈

实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。
在这里插入图片描述

👉④.福利篇👈

最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费
在这里插入图片描述
相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!

您可能感兴趣的与本文相关的镜像

Llama Factory

Llama Factory

模型微调
LLama-Factory

LLaMA Factory 是一个简单易用且高效的大型语言模型(Large Language Model)训练与微调平台。通过 LLaMA Factory,可以在无需编写任何代码的前提下,在本地完成上百种预训练模型的微调

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值