大模型使用-规划与智能体-基于大模型的智能体

一个研究技术、玄学、金融的干过码农的人

已于 2025-01-10 14:48:09 修改

阅读量434

点赞数 4

分类专栏：大模型文章标签：学习人工智能深度学习大模型

于 2024-12-23 09:38:33 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/sgliquangang/article/details/144616172

版权

大模型专栏收录该内容

33 篇文章

订阅专栏

一、简介

智能体概念：一个具备环境感知、决策制订与动作执行的自主算法系统
研发智能体目的：模拟人类或其他生物的智能行为，只在自动化的解决问题或执行任务

二、概述

发展阶段
- 早期：预定义好所有的规则和逻辑
- 当前：基于AI的智能体，不依赖预先定义的规则逻辑
核心技术：使用强化学习方法，智能体通过与环境的交互来学习最佳行为策略

三、基于大模型智能体的构建

1、核心组件

记忆组件
规划组件
执行组件

2、记忆组件

存储内容：存储智能体与环境的交互记录，并能随时检索，支持多模态数据存储，分为短期记忆与长期记忆
- 短期记忆：负责暂时存储和处理智能体相关信息的载体。在大模型智能体中，短期记忆对应模型内部的上下文窗口
- 长期记忆：
  - 存储内容：存储长期积累信息，包含智能体名称与功能定义、用户的配置文件、近期经历等等
  - 存储形式：可以是文本文件、结构化数据库等
  - 存储位置：通常使用外部存储实现
  - 存储触发机制：通过反思机制进行写入更新

3、规划组件

作用：为智能体引入类似人类解决任务的思考方式，将复杂任务拆解为一系列简单的子任务，进而逐一解决

4、执行组件

作用：执行规划组件生成的解决方案的实际步骤，需要记忆组件与规划组件的协同
执行工具：模型、外部工具等等

四、多智能体系统

概念：使用多个智能体扮演特定角色，一起完成复杂任务
构建方法：确定目标 -> 定义不同角色对应的智能体实例 -> 定义不同智能体之间的交互方式（协作、竞争、信息交流等多方面）
通讯协同机制：
- 通讯机制：
  - 通讯协议：通讯协议规定了智能体之间如何进行信息交换和共享，包括通讯的方式、频率、时序等
  - 通讯拓扑：通讯拓扑则定义了智能体之间的连接关系，即哪些智能体之间可以进行直接通讯，哪些需要通过其他智能体进行间接通
  - 通讯内容：通讯内容是指智能体之间实际传输的信息，包括状态信息、控制指令、任务目标等，其形式可以是自然语言、结构化数据或者代码等。
- 协同机制：
  - 协作：协作指的是智能体通过共享资源、信息和任务分配来实现共同目标
  - 竞争：竞争则涉及到在资源有限的环境中，智能体之间的竞争关系，通过博弈论和竞价机制，使得整体系统可以在竞争中寻求最优解决方案
  - 协商：协商是指智能体通过交换信息和让步来解决目标或资源的冲突。

五、大模型智能体的典型应用

WebGPT：由OpenAI 开发的一款具有信息检索能力的大语言模型，它基
于GPT-3 模型微调得到，可以看作是大语言模型智能体的一个早期雏形。WebGPT能够理解用户的自然语言查询，自动在互联网上搜索相关网页，能够点击、浏览、收藏相关网页信息，对搜索结果进行分析和整合，最终以自然语言的形式提供准确全面的回答，并提供参考文献
MetaGPT：是一个基于多智能体系统的协作框架，旨在模仿人类组织的
运作方式，模拟软件开发过程中的不同角色和协作。相关角色包括产品经理、架
构师、项目经理、软件工程师及测试工程师等，并遵循标准化的软件工程运作流
程对不同角色进行协调，覆盖了需求分析、需求文档撰写、系统设计、工作分配、代码实现、系统测试等软件开发全生命周期，最终满足特定软件开发项目的需求。
《西部世界》沙盒模拟：大语言模型智能体在社会模拟中的应用

六、大模型智能体待解决关键技术问题

算力消耗大
复杂工具调用难
多智能体交互困难、效率低
智能体依赖的AI能力存在不足
真实世界智能体模拟效果差

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。