一、简介
- 智能体概念:一个具备环境感知、决策制订与动作执行的自主算法系统
- 研发智能体目的:模拟人类或其他生物的智能行为,只在自动化的解决问题或执行任务
二、概述
- 发展阶段
- 早期:预定义好所有的规则和逻辑
- 当前:基于AI的智能体,不依赖预先定义的规则逻辑
- 核心技术:使用强化学习方法,智能体通过与环境的交互来学习最佳行为策略
三、基于大模型智能体的构建
1、核心组件
- 记忆组件
- 规划组件
- 执行组件
2、记忆组件
- 存储内容:存储智能体与环境的交互记录,并能随时检索,支持多模态数据存储,分为短期记忆与长期记忆
- 短期记忆:负责暂时存储和处理智能体相关信息的载体。在大模型智能体中,短期记忆对应模型内部的上下文窗口
- 长期记忆:
- 存储内容:存储长期积累信息,包含智能体名称与功能定义、用户的配置文件、近期经历等等
- 存储形式:可以是文本文件、结构化数据库等
- 存储位置:通常使用外部存储实现
- 存储触发机制:通过反思机制进行写入更新
3、规划组件
- 作用:为智能体引入类似人类解决任务的思考方式,将复杂任务拆解为一系列简单的子任务,进而逐一解决
4、执行组件
- 作用:执行规划组件生成的解决方案的实际步骤,需要记忆组件与规划组件的协同
- 执行工具:模型、外部工具等等
四、多智能体系统
- 概念:使用多个智能体扮演特定角色,一起完成复杂任务
- 构建方法:确定目标 -> 定义不同角色对应的智能体实例 -> 定义不同智能体之间的交互方式(协作、竞争、信息交流等多方面)
- 通讯协同机制:
- 通讯机制:
- 通讯协议:通讯协议规定了智能体之间如何进行信息交换和共享,包括通讯的方式、频率、时序等
- 通讯拓扑:通讯拓扑则定义了智能体之间的连接关系,即哪些智能体之间可以进行直接通讯,哪些需要通过其他智能体进行间接通
- 通讯内容:通讯内容是指智能体之间实际传输的信息,包括状态信息、控制指令、任务目标等,其形式可以是自然语言、结构化数据或者代码等。
- 协同机制:
- 协作:协作指的是智能体通过共享资源、信息和任务分配来实现共同目标
- 竞争:竞争则涉及到在资源有限的环境中,智能体之间的竞争关系,通过博弈论和竞价机制,使得整体系统可以在竞争中寻求最优解决方案
- 协商:协商是指智能体通过交换信息和让步来解决目标或资源的冲突。
- 通讯机制:
五、大模型智能体的典型应用
- WebGPT:由OpenAI 开发的一款具有信息检索能力的大语言模型,它基
于GPT-3 模型微调得到,可以看作是大语言模型智能体的一个早期雏形。WebGPT能够理解用户的自然语言查询,自动在互联网上搜索相关网页,能够点击、浏览、收藏相关网页信息,对搜索结果进行分析和整合,最终以自然语言的形式提供准确全面的回答,并提供参考文献 - MetaGPT:是一个基于多智能体系统的协作框架,旨在模仿人类组织的
运作方式,模拟软件开发过程中的不同角色和协作。相关角色包括产品经理、架
构师、项目经理、软件工程师及测试工程师等,并遵循标准化的软件工程运作流
程对不同角色进行协调,覆盖了需求分析、需求文档撰写、系统设计、工作分配、代码实现、系统测试等软件开发全生命周期,最终满足特定软件开发项目的需求。 - 《西部世界》沙盒模拟:大语言模型智能体在社会模拟中的应用
六、大模型智能体待解决关键技术问题
- 算力消耗大
- 复杂工具调用难
- 多智能体交互困难、效率低
- 智能体依赖的AI能力存在不足
- 真实世界智能体模拟效果差