一 概念
- 什么是AI Agent
- 学术界和工业界对术语“AI Agent”提出了各种定义。其中,OpenAI将AI Agent定义为“以大语言模型为大脑驱动的系统,具备自主理解、感知、规划、记忆和使用工具的能力,能够自动化执行完成复杂任务的系统。”
- 为什么需要Ai agent
- LLM 的一些缺点:
- 会产生幻觉
- 结果并不总是真实的
- 对时事的了解有限或一无所知
- 很难应对复杂的计算
- 没有行动能力
- 没有长期记忆能力
比如让 ChatGPT 买一杯咖啡,ChatGPT 给出的反馈一般类似 “无法购买咖啡,它只是一个文字 AI 助手” 之类的回答。但你要告知基于 ChatGPT 的 AI Agent 工具让它买一杯咖啡,它会首先拆解如何才能为你购买一杯咖啡并拟定代用某 APP 下单以及支付等若干步骤,然后按照这些步骤调用 APP 选择外卖,再调用支付程序下单支付,过程无需人类去指定每一步操作。这就是 AI Agent 的用武之地,它可以利用外部工具来克服这些限制。这里的工具是什么呢?工具就是代理用它来完成特定任务的一个插件、一个集成 API、一个代码库等等,例如: - Google 搜索:获取最新信息
- Python REPL:执行代码
- Wolfram:进行复杂的计算
- 外部 API:获取特定信息
而 LangChain 则是提供一种通用的框架通过大语言模型的指令来轻松地实现这些工具的调用。我们都知道在执行一个复杂的任务时,我们需要考虑多方面的影响因素,将复杂任务拆分为细小的子任务去执行。AI Agent 的诞生就是为了处理各种复杂任务的,就复杂任务的处理流程而言 AI Agent 主要分为两大类:行动类、规划执行类。总而言之,AI Agent 就是结合大模型能去自动思考、规划、效验和执行的一个计算体,以完成特定的任务目标,如果把大模型比作大脑,那 AI Agent 可以理解为小脑 + 手脚。
- LLM 的一些缺点:
- AIAgent与LLM的关系
- 大模型是AI Agent实现的前提和基础。
- 我们可以把AI Agent与LLM形象地比作生物体与其大脑
- AI Agent有手有脚,可以自己干活与执行,而LLM呢,就是它的大脑。
- Ai Agent训练包含的技术有哪些
基于大模型训练Agent主要涉及到模型微调(Fine-tuning)、指令微调(Instruction Tuning)、工具调用以及多智能体协作等技术。训练Agent的步骤:- 选择基础模型:首先,需要选择一个预训练的大模型作为基础,例如LLaMA、GPT-3等。
- 数据准备:根据应用场景准备训练数据,这些数据应包括用户指令、Agent执行的动作、工具调用等。
- 模型微调:使用准备好的数据对基础模型进行微调,以适应特定的任务和工具。
- 指令微调:通过指令微调技术,让模型更好地理解和执行复杂的指令。
- 工具调用:训练模型学会调用外部工具,如API、数据库等,以增强其解决问题能力。
- 多智能体协作:如果需要,训练模型与其他智能体协作完成任务。
参考链接
- https://mp.weixin.qq.com/s/K638K5NPUGyXcQ5plm1ZgQ
- https://mp.weixin.qq.com/s/Ngtoz8gcK2QBfb8bx0CeGw
- https://www.cnblogs.com/huaweiyun/p/18289995