大模型使用-规划与智能体-基于大模型的智能体

一、简介

  • 智能体概念:一个具备环境感知、决策制订与动作执行的自主算法系统
  • 研发智能体目的:模拟人类或其他生物的智能行为,只在自动化的解决问题或执行任务

二、概述

  • 发展阶段
    • 早期:预定义好所有的规则和逻辑
    • 当前:基于AI的智能体,不依赖预先定义的规则逻辑
  • 核心技术:使用强化学习方法,智能体通过与环境的交互来学习最佳行为策略

三、基于大模型智能体的构建

1、核心组件
  • 记忆组件
  • 规划组件
  • 执行组件
2、记忆组件
  • 存储内容:存储智能体与环境的交互记录,并能随时检索,支持多模态数据存储,分为短期记忆与长期记忆
    • 短期记忆:负责暂时存储和处理智能体相关信息的载体。在大模型智能体中,短期记忆对应模型内部的上下文窗口
    • 长期记忆:
      • 存储内容:存储长期积累信息,包含智能体名称与功能定义、用户的配置文件、近期经历等等
      • 存储形式:可以是文本文件、结构化数据库等
      • 存储位置:通常使用外部存储实现
      • 存储触发机制:通过反思机制进行写入更新
3、规划组件
  • 作用:为智能体引入类似人类解决任务的思考方式,将复杂任务拆解为一系列简单的子任务,进而逐一解决
4、执行组件
  • 作用:执行规划组件生成的解决方案的实际步骤,需要记忆组件与规划组件的协同
  • 执行工具:模型、外部工具等等

四、多智能体系统

  • 概念:使用多个智能体扮演特定角色,一起完成复杂任务
  • 构建方法:确定目标 -> 定义不同角色对应的智能体实例 -> 定义不同智能体之间的交互方式(协作、竞争、信息交流等多方面)
  • 通讯协同机制:
    • 通讯机制:
      • 通讯协议:通讯协议规定了智能体之间如何进行信息交换和共享,包括通讯的方式、频率、时序等
      • 通讯拓扑:通讯拓扑则定义了智能体之间的连接关系,即哪些智能体之间可以进行直接通讯,哪些需要通过其他智能体进行间接通
      • 通讯内容:通讯内容是指智能体之间实际传输的信息,包括状态信息、控制指令、任务目标等,其形式可以是自然语言、结构化数据或者代码等。
    • 协同机制:
      • 协作:协作指的是智能体通过共享资源、信息和任务分配来实现共同目标
      • 竞争:竞争则涉及到在资源有限的环境中,智能体之间的竞争关系,通过博弈论和竞价机制,使得整体系统可以在竞争中寻求最优解决方案
      • 协商:协商是指智能体通过交换信息和让步来解决目标或资源的冲突。

五、大模型智能体的典型应用

  • WebGPT:由OpenAI 开发的一款具有信息检索能力的大语言模型,它基
    于GPT-3 模型微调得到,可以看作是大语言模型智能体的一个早期雏形。WebGPT能够理解用户的自然语言查询,自动在互联网上搜索相关网页,能够点击、浏览、收藏相关网页信息,对搜索结果进行分析和整合,最终以自然语言的形式提供准确全面的回答,并提供参考文献
  • MetaGPT:是一个基于多智能体系统的协作框架,旨在模仿人类组织的
    运作方式,模拟软件开发过程中的不同角色和协作。相关角色包括产品经理、架
    构师、项目经理、软件工程师及测试工程师等,并遵循标准化的软件工程运作流
    程对不同角色进行协调,覆盖了需求分析、需求文档撰写、系统设计、工作分配、代码实现、系统测试等软件开发全生命周期,最终满足特定软件开发项目的需求。
  • 《西部世界》沙盒模拟:大语言模型智能体在社会模拟中的应用

六、大模型智能体待解决关键技术问题

  • 算力消耗大
  • 复杂工具调用难
  • 多智能体交互困难、效率低
  • 智能体依赖的AI能力存在不足
  • 真实世界智能体模拟效果差
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值