正文开始之前,先给我自己打个广告,双12超级活动,原价199元的《3天 AI Agent 智能体项目实战直播训练营》,为了回馈粉丝们的支持,直接降价到19元,今天再开放一天报名特权,仅限99名,按照这个速度,估计一会就能抢完,抢完之后立刻涨价到 199 元!
回到正题。
Agent 智能体的架构设计由以下4个关键模块构成:

身份识别模块(Profile):该模块的主要功能是对Agent的角色进行识别,解决的核心问题是:我的身份是什么?我处于什么位置?我应该执行哪些任务?这一模块适用于各种协同场景,包括人与人、人与智能体、以及智能体之间的协同。
记忆存储模块(Memory):记忆模块负责信息的存储、提取和查询,是智能体知识管理的基础。
策略规划模块(Planning):此模块负责根据历史行为和目标来动态规划智能体的未来行动步骤。
行动执行模块(Action):该模块负责实施智能体的决策,确保智能体的行为能够得到有效执行。
以下对 Agent 智能体架构设计的4个模块做详细剖析。
—1— 身份识别模块(Profile)
角色识别模块的主要功能是确定智能体的角色定位。智能体通过扮演不同的角色来完成特定任务,这些角色可能包括程序员、教师或行业专家等。该模块通过在提示词中嵌入智能体的配置文件来引导大型语言模型(LLM)的行为。智能体的配置文件通常包含基础信息(比如:年龄、性别和职业)、心理特征(展示智能体的性格特点)以及社交细节(描述智能体之间的互动关系)。
角色生成策略概述如下:
- 手动配置策略:智能体的配置文件是由人工编制的。例如,生成型智能体通过提供姓名、目标以及与其他智能体的关系等细节来定义智能体。
- LLM 驱动生成策略:智能体的配置文件由大型语言模型自动创建。比如:RecAgent首先构建几个初始配置文件,随后利用 ChatGPT 来扩展这一配置文件库。
- 数据集匹配策略:智能体的配置文件来源于现实世界的数据集。比如:利用美国国家选举研究(ANES)中的参与者背景信息来为 GPT-4 分配相应的角色。
—2— 记忆存储模块(Memory)
记忆存储模块在智能体架构中扮演着至关重要的角色。它负责存储智能体从环境中获取的信息,并通过这些记忆来指导未来的行动。该模块使得智能体能够积累经验、实现自我提升,并以更加连贯、合理和高效的方式行动。
记忆模块的结构包括:
- 统一记忆:这种结构仅模拟人类的短期记忆,通常通过上下文学习来实现。比如:RLP 和 SayPlan 就是利用上下文信息作为短期记忆的实例。
- 混合记忆:这种结构同时模拟人类的短期和长期记忆。比如:Generative Agent 和 AgentSims 采用向量数据库来实现长期记忆的存储。
记忆模块的格式包括:
- 自然语言:记忆信息直接以自然语言的形式进行描述。比如:Reflexion 和Voyager 就是使用自然语言来存储体验反馈的。
- 嵌入:记忆信息被编码成嵌入向量。比如:MemoryBank 和 ChatDev 将对话历史编码成向量形式。
- 数据库:记忆信息存储在数据库中。比如:ChatDB 和 DB-GPT 使用数据库作为记忆的存储介质。
- 结构化列表:记忆信息被整理成列表形式。比如:GITM 使用层次树结构来存储子目标的行动列表。
记忆模块的操作包括:
- 记忆读取:从记忆中提取有价值的信息以增强智能体的行动能力。比如:Generative Agent 和 GITM 通过使用基于近期性、相关性和重要性的评分函数来提取信息。
- 记忆写入:将感知的环境信息存入记忆中。比如:ChatDB 和 RET-LLM 采用不同的策略来处理记忆中的重复和溢出问题。
- 记忆反思:模拟人类的反思过程,生成更抽象、更复杂、更高层次的信息。比如:Generative Agent 和 GITM 通过反思来形成更高层次的见解。
—3— 策略规划模块(Planning)
规划模块的目标是使智能体具备类似于人类的能力,即能够将复杂的任务拆分为更简单的子任务并逐一解决。根据智能体在规划过程中是否能够接收反馈,规划模块可以分为两大类:无反馈规划和有反馈规划。
无反馈规划的类别如****下:
- 单一路径推理:将最终任务拆分为一系列中间步骤,每个步骤仅导向一个后续步骤。比如:Chain of Thought(CoT)和 Zero-shot-CoT 采用推理步骤作为提示词。
- 多路径推理:推理步骤以树状结构组织,每个中间步骤可能对应多个后续步骤。比如:Self-consistent CoT(CoT-SC)和T ree of Thoughts(ToT)采用树状推理结构来生成计划。
- 外部规划器:使用外部规划器来生成计划。比如:LLM+P 和 LLM-DP 利用外部规划器处理 PDDL 问题。
有反馈规划的类别包括:
- 环境反馈:通过从环境中获取反馈来影响智能体的未来行为。比如:ReAct 和Voyager 利用环境反馈来进行规划。
- 人类反馈:直接与人类互动以获得反馈。比如:Inner Monologue 通过人类反馈来调整其行动策略。
- 模型反馈:利用预训练模型生成反馈。比如:Reflexion 和 SelfCheck 通过模型反馈来改进其推理过程。
—4— 行动执行模块(Action)
行动模块的任务是将智能体的决策转化为具体的行动成果。这一模块位于整个架构的末端,直接与环境进行交互,并受到角色、记忆和规划模块的影响。
行动模块的目标包括:
- 完成任务:智能体的行动旨在实现特定的任务目标。比如:Voyager 和 ChatDev中的 智能体就是为了完成任务而行动。
- 沟通交流:智能体的行动旨在与其他智能体或真实人类进行交流。比如:ChatDev 和 Inner Monologue 中的智能体进行沟通活动。
- 环境探索:智能体的行动旨在探索未知的环境。比如:Voyager 中的智能体探索新的技能领域。
行动生成的途径有:
- 基于记忆的行动生成:智能体根据当前任务从其记忆中提取信息来生成行动。比如:Generative Agent 和 GITM 利用记忆信息来指导行动。
- 基于计划的行动执行:智能体按照预先制定的计划来采取行动。比如:DEPS 和 GITM 中的智能体遵循既定计划。
行动空间分为:
- 外部工具:使用外部 API、数据库和外部模型来扩展行动的可能性。比如:HuggingGPT、ChatDB 和 ChemCrow 利用外部工具。
- 内部知识:依赖大型语言模型(LLMs)的内部知识来指导行动。比如:DEPS、ChatDev 和 Generative Agent 利用 LLMs 的规划、对话和常识理解能力。
行动的影响包括:
- 改变环境状态:智能体的行动直接作用于环境。比如:GITM 和 Voyager 中的智能体能够改变环境。
- 改变内部状态:智能体的行动会影响其自身的状态。比如:Generative Agent 和 SayCan 中的智能体会更新其记忆。
- 触发后续行动:一个行动可能导致另一个行动的发生。比如:Voyager 中的智能体在收集到所有必要资源后开始建造建筑物。
通过这些模块的协同工作,基于 LLM 的自主智能体能够模仿人类行为,有效地执行各种任务。
总之 AI Agent 智能体如此重要,人人都需要掌握的核心技能!为了帮助你快速学习、理解、掌握和实践强大的 AI Agent 智能体技术,我们特别邀请了多位业内顶尖专家,精心打造了一套企业级项目实战的《3天 AI Agent 项目实战直播训练营》!直播课程涵盖从基础理论到实际项目部署的全方位知识体系,助力你在激烈的职场竞争中脱颖而出。
原价199元的《3天 AI Agent 智能体项目实战直播训练营》,直接降价到19元,就开放今天一天报名特权,限99名,按照这个速度,一会就能抢完,抢完立刻涨价到 199 元!
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费】

2054

被折叠的 条评论
为什么被折叠?



