本文是一份关于AI智能体(Agents)的白皮书,详细介绍了AI智能体的概念、架构、工具使用以及如何通过特定的学习方法提升模型性能。白皮书还探讨了如何将AI智能体应用于生产环境,并提供了实际的代码示例和应用架构。以下是对这份白皮书核心内容的详细介绍:
一、引言
-
主题:探讨AI智能体的概念、架构和应用。
-
目标:帮助读者理解AI智能体如何通过工具使用和推理能力扩展生成式AI模型的功能。
二、什么是AI智能体?
-
定义:AI智能体是一种应用,通过观察世界并使用其可用的工具来实现目标。
-
自主性:智能体能够独立于人类干预行动,尤其是在被赋予明确目标时。
-
主动性:即使没有人类的明确指令,智能体也能主动规划下一步行动以实现其最终目标。
三、智能体的组成部分
-
模型:作为智能体的核心决策者,模型可以是一个或多个语言模型,能够基于指令进行推理和逻辑框架操作。
-
工具:工具使智能体能够与外部世界互动,访问实时信息或执行实际操作。
-
编排层:描述了智能体如何接收信息、进行内部推理,并据此决定下一步行动或决策的循环过程。
四、智能体与模型的区别
-
知识范围:模型的知识限于其训练数据,而智能体通过工具与外部系统连接,扩展其知识范围。
-
会话管理:智能体能够管理会话历史,支持多轮推理/预测,而模型通常不管理会话历史。
-
工具和逻辑层:智能体原生支持工具和逻辑层,而模型则没有。
五、认知架构:智能体如何运作
-
类比:将智能体比作忙碌厨房中的厨师,通过规划、执行和调整来实现目标。
-
推理框架:介绍了ReAct、Chain-of-Thought(CoT)和Tree-of-Thoughts(ToT)等推理框架,这些框架帮助智能体进行推理和规划。
六、工具:智能体与外部世界的桥梁
-
扩展(Extensions):作为API和智能体之间的标准化桥梁,使智能体能够无缝执行API调用。
-
函数(Functions):允许模型决定何时使用特定函数及其参数,函数在客户端执行。
-
数据存储(Data Stores):为智能体提供访问结构化或非结构化数据的能力,支持数据驱动的应用。
七、提升模型性能的针对性学习
-
上下文学习:在推理时提供提示、工具和少量示例,使模型能够即时学习如何使用工具。
-
基于检索的上下文学习:动态地从外部存储中检索相关信息、工具和示例,以丰富模型提示。
-
基于微调的学习:在推理之前,使用大量特定示例对模型进行训练,帮助模型理解何时以及如何应用特定工具。
八、使用LangChain快速启动智能体
-
示例代码:提供了使用LangChain和LangGraph库构建智能体的示例代码,展示如何通过组合逻辑、推理和工具调用来回答用户查询。
九、使用Vertex AI智能体进行生产应用
-
Vertex AI平台:提供了一个完全托管的环境,简化了构建生产级智能体的过程。
-
架构示例:展示了在Vertex AI平台上构建的智能体架构,包括Vertex Agent Builder、Vertex Extensions、Vertex Function Calling和Vertex Example Store等组件。
十、总结
-
智能体的能力:通过工具使用和推理能力,智能体扩展了语言模型的功能,能够自主完成复杂任务。
-
编排层的重要性:编排层作为智能体的核心,结构化推理、规划和决策过程。
-
工具的作用:工具使智能体能够与外部系统互动,访问超出其训练数据的知识。
-
未来展望:随着工具的日益复杂和推理能力的增强,智能体将能够解决越来越复杂的问题。