【AI大模型】一文讲清任务型Agent架构,零基础小白收藏这一篇就够了!!

部署运行你感兴趣的模型镜像

一、前言

在信贷风控领域下,以加工出具有“高效能”和“高可解释性”的策略为目标,其中:策略加工过程会涉及不同场景下的要素切分和融合,切分的阈值和融合的规则通常采用运筹算法在满足特定的约束条件下来求最优解,求最优解的过程需要人工不断地去重跑运筹算法,并“人肉串联”从切分到融合整个流程。策略加工后随着时间推移,策略会面临要素迭代滞后、性能衰退等问题,从而缺乏系统性优化机制。围绕着这两个问题设计出两个 Agent 来解决相应的问题:

  • 要素融合 Agent:提供“轻智能版”(workflow模式)和“智能版”(基于 Reflection 的自主规划模式)两种模式对要素进行切分和融合。
  • 策略优化 Agent:采用 ReAct 模式对规则进行分析,分析出规则存在的性能瓶颈并做出优化。

二、Agent 模式选择

2.1 常规 Agent 模式

a. LLM 自主规划类

  • ReAct:reason(推理)-> action(行动) -> observation(观察)。
  • Plan and Execute:规划与执行,先规划好完整步骤,再分步执行。
  • Reflection:反思驱动。大模型通过自我反思修正当前的结论。由此衍生出的常用模式(即本项目采用的模式)如下:
Step 1:思考当前需求,并初步生成执行计划Step 2:执行执行计划中的每个节点,且每执行完一个节点时,会根据节点输出更新执行计划(已执行的节点不能再变更)Step 3:直到所有节点执行完成,则结束当前执行计划

b. Workflow 预编排类

​ 固定业务流程模板并按顺序调度即可,大模型除起到串联参数外,通常也会作用到某个节点(比如 Agent 节点)。

2.2 怎么选择 Agent 模式?

​ 选择怎么样的 Agent 模式还是要回归到业务本身,信贷风控领域下要素的产生和策略的优化都耗时耗力,比如拿要素切分来说,除前置的数据处理外,使用固定的切分算法(如等频切分)耗时基本都是小时级别。所以结合任务的长周期性和资源耗费情况,要素融合 Agent 采用了带 Reflection 的自主规划模式,即先让大模型生成候选执行计划(Execute Plan)列表,再做策略(比如最大置信度)选择,最后执行计划节点执行过程中不断的刷新执行计划。要素融合 Agent 不采用 ReAct 模式考虑点如下:

  • 从交互体验上讲,ReAct 模式是先选择工具,再执行工具,要素融合工具往往参数比较多,过程中可能需要不断地反问用户,而 Reflection 模式提前规划好执行计划,用户可通过一次性填参避免频繁交互。

  • 从“策略生成”这种业务模式上讲,采用 ReAct 模式太发散,容易走很多弯路,浪费计算资源。

  • Reflection 模式先全局生成候选执行计划列表,在执行过程中不断的刷新执行计划本质上已经覆盖了 ReAct 模式,如果单纯使用 ReAct 模式,可能面临结点执行失败而导致整个执行计划失败,由于每个结点执行起来很“重”,最好执行前就保证执行路径的正确性,而全局规划正在是解决这个问题,并提供一个尽快、尽全的模式。

策略优化 Agent 解决的是规则性能问题,过程需要结合专家经验知识、工具查询的事实结果等信息来决定策略怎么优化,非常符合 ReAct 模式。

三、需求分析

​ 与常规需求分析不同的是,理论上大模型的需求调研和初步可行性分析的执行者的角色从技术向产品(或运营)转变。然而信贷风控属于偏中后台的领域,往往缺少兼风控知识和AI产品经验的产品,所以就需要技术深度参与其中。技术在整个需求调研过程中,核心关注:

  • 策略是怎么产生的。策略的产生是一个周期长而且复杂的流程,同时策略也会分不同的细分场景,所以要先以某入垂直场景做切入点,再横向扩展。因涉及到利益关系和各方(研发、算法和策略)的参与程度不同,往往生产关系的解决也是非常核心的一环。

  • 需求分析包含:Agent 定义、用例描述(分类及对话方式举例)、可能涉及的工具、大模型作用的业务场景等。

四、Agent 领域模型

​ 先放一张 OpenAI 研究主管 Lilian Weng 给 Agent 的定义图:Agent=大模型(LLM)+规划(Planning)+记忆(Memory)+工具使用(Tool Use):

图片

附:图片来源文章《LLM Powered Autonomous Agents》,地址:https://lilianweng.github.io/posts/2023-06-23-agent/

​ 结合 Agent 定义和信贷风控领域的长周期的特点定义了任务型Agent下的领域模型,如下图:

图片

该领域模型是一个通用的领域模型,目前支持了Workflow、ReAct、基于 Reflection 模式下的 Agent 设计。核心领域概念如下图(这里先不讲多智能体的概念):

中文英文解释
AgentAgentagent 定义
Agent任务(模板)AgentTaskTemplateAgent 一般会支持多类任务,通过意图识别来路由不同的任务类型,比如要素融合 Agent 有几类任务:评级切分、评级融合等
执行计划ExecutePlan简称EP,大模型规划或者人工预设的工作流,是一个有向无环图。这里采用 GraphViz 语言定义图。
执行计划模板ExecutePlanTemplate在 workflow 模式下由人工预设的执行计划图
会话Chat用户会话
用户任务UserTask是为多智能体设计的,中枢 Agent 会将用户一句话拆解成多个用户任务,每一个用户任务由单独的 Agent 完成
Agent 任务AgentTaskAgent任务实例,比如评级切分任务实例等。一个用户任务对应多个Agent任务实例
Prompt模板PromptTemplate提示词模板
工具组ToolGroup一般任务型Agent使用的都是异步工具,这里将异步工具拆分为提交、查询、中止三个工具,合称为一个工具组
工具Tool异步工具的提交、查询、中止是三个工具;同步工具只有一个提交工具

五、Agent 引发地思考

1.为什么要做 Agent?Agent 解决了什么业务问题?常规的 GUI 方式不能解决问题吗?

虽然在 Agent 元年尝试新技术无可厚非,但这个问题在什么场合下都规避不了,必须要找到合理的答案。常规大模型主要解决以下两类问题:

  • 借助大模型能力,以更加便捷的方式(LUI等)替换原有 GUI 方式为用户提效。比如降低应用开发门槛、简化流程复杂度(如抽参)、协同完成某项复杂任务等。
  • 利用大模型进行决策,比如结合业务专家经验知识进行路径规划和业务分支决策。这一点比较有说服力。

要素融合 Agent 利用了 Agent 串联协作和大模型决策能力,策略优化 Agent 结合丰富的策略专家经验知识利用了大模型决策能力。另外,想清楚业务每个点在使用大模型解决怎么问题?大模型核心优化点在哪里?非常感谢今年带我的老板,虽然整个 Agent 项目效果不尽如意,但最终以另一种形式得到延续。

2.开发思维要转变

​ Agent 是人的代理,理解到这一层是 Agent 开发者入门的体现。比如以“人”能理解的语言去描述技术方案,执行计划状态机系统上的描述是“暂停“,对用户的描述是”待用户输入中”。

3. less structure, more intelligence

​ 引用集团内网某位大佬的描述:

传统软件开发强调结构化、模块化和流程确定性,通过定义函数、类、借口和工作流来实现功能。而“less structure, more intelligence”则是一种依赖”智能涌现“的设计思想:不预设 workflow 和 step,通过提供一个更强的智能内核(微调大模型)和更自由的执行环境(集成虚拟机),让AI自主探索和决定最佳路径。

​ 这个想法现阶段还是较理想化,产品化的 Agent 交互很难做到这一点,即使真正能做到智能化,还需要考虑业务方是否能接收?用户渗透率如何?据业界的一个统计数字,依赖 wokflow 模式的场景占 Agent 模式的 90%以上。根据实战经验,即使 workflow 模式下 Agent 也避免不了各种产品的优化:COT和思考路径的展示、通过卡片和按钮等方式怎么限制用户和大模型、任务型异步工具执行完成怎么触达用户等等。

六、小结

​ 啰嗦了这么多,但我觉得这些想法确实值得记录。2025年AI发展迅猛,该项目自3月启动以来,历经 MCP、A2A 等协议的推出,以及各类 Agent 框架的快速兴起,许多新技术的演进令人感同身受。

最后

为什么要学AI大模型

当下,⼈⼯智能市场迎来了爆发期,并逐渐进⼊以⼈⼯通⽤智能(AGI)为主导的新时代。企业纷纷官宣“ AI+ ”战略,为新兴技术⼈才创造丰富的就业机会,⼈才缺⼝将达 400 万!

DeepSeek问世以来,生成式AI和大模型技术爆发式增长,让很多岗位重新成了炙手可热的新星,岗位薪资远超很多后端岗位,在程序员中稳居前列。

在这里插入图片描述

与此同时AI与各行各业深度融合,飞速发展,成为炙手可热的新风口,企业非常需要了解AI、懂AI、会用AI的员工,纷纷开出高薪招聘AI大模型相关岗位。
在这里插入图片描述
最近很多程序员朋友都已经学习或者准备学习 AI 大模型,后台也经常会有小伙伴咨询学习路线和学习资料,我特别拜托北京清华大学学士和美国加州理工学院博士学位的鲁为民老师给大家这里给大家准备了一份涵盖了AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频 全系列的学习资料,这些学习资料不仅深入浅出,而且非常实用,让大家系统而高效地掌握AI大模型的各个知识点。

这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费

AI大模型系统学习路线

在面对AI大模型开发领域的复杂与深入,精准学习显得尤为重要。一份系统的技术路线图,不仅能够帮助开发者清晰地了解从入门到精通所需掌握的知识点,还能提供一条高效、有序的学习路径。

img

但知道是一回事,做又是另一回事,初学者最常遇到的问题主要是理论知识缺乏、资源和工具的限制、模型理解和调试的复杂性,在这基础上,找到高质量的学习资源,不浪费时间、不走弯路,又是重中之重。

AI大模型入门到实战的视频教程+项目包

看视频学习是一种高效、直观、灵活且富有吸引力的学习方式,可以更直观地展示过程,能有效提升学习兴趣和理解力,是现在获取知识的重要途径

在这里插入图片描述
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

海量AI大模型必读的经典书籍(PDF)

阅读AI大模型经典书籍可以帮助读者提高技术水平,开拓视野,掌握核心技术,提高解决问题的能力,同时也可以借鉴他人的经验。对于想要深入学习AI大模型开发的读者来说,阅读经典书籍是非常有必要的。
在这里插入图片描述

600+AI大模型报告(实时更新)

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
在这里插入图片描述

AI大模型面试真题+答案解析

我们学习AI大模型必然是想找到高薪的工作,下面这些面试题都是总结当前最新、最热、最高频的面试题,并且每道题都有详细的答案,面试前刷完这套面试题资料,小小offer,不在话下
在这里插入图片描述

在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费

您可能感兴趣的与本文相关的镜像

Llama Factory

Llama Factory

模型微调
LLama-Factory

LLaMA Factory 是一个简单易用且高效的大型语言模型(Large Language Model)训练与微调平台。通过 LLaMA Factory,可以在无需编写任何代码的前提下,在本地完成上百种预训练模型的微调

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值