一、书籍内容简介
对于构建 Agent 来说,目前业界已经具备技术基础,包括大模型和 AIGC 模型、人工智能应用开发框架和工具、软件平台、丰富的数据等。只要结合具体的业务场景,将现有技术进行整合,就能开发出满足需求的 Agent。
《动手做 AI Agent》从零基础出发,介绍了 Agent 的定义、特性与技术架构,还对构建 Agent 的 AI 技术工具进行了详细讲解,最后以 7 个实战项目展示了 Agent 开发的方法。按照“基础知识——技术工具——项目实战”三部分来组织内容,帮助读者从理论学习推进到动手实际操作。
有需要《大模型RAG实战:RAG原理、应用与系统构建》完整版书PDF,可以微信扫描下方二维码,立即免费领取!
(长按图片即可添加)
二、书籍章节目录
1、基础知识
这部分先是定义了 Agent 的概念,然后说明大模型对于 Agent 的重要程度如同大脑,这是 Agent 进行理解和决策的基础。还对 Agent 的四大特性与四大核心组件进行介绍。
第1章 何为Agent,为何Agent
-
1.1 大开脑洞的演讲:Life 3.0
-
1.2 那么,究竟何为Agent
-
1.3 Agent的大脑:大模型的通用推理能力
-
1.4 Agent的感知力:语言交互和多模态
-
1.5 Agent的行动力:语言输出和工具使用
-
1.6 Agent对各行业的效能提升
-
1.7 Agent带来新的商业模式和变革
2、技术工具
书中介绍了 Agent 架构的四大要素,分别是规划、记忆、工具、执行。重点介绍了当前流行的 ReAct 框架。详细说明了以下技术工具的使用方法。
-
OpenAI API 以及 OpenAI Assistants:用于调用包含 GPT-4 模型 和 DALL·E 3 模型在内的众多人工智能模型。
-
LangChain:开源框架,专门用于构建和开发由大型语言模型驱动的应用程序,其中包含对 ReAct 框架的封装和实现。
-
LlamaIndex:开源框架,用于帮助管理和检索非结构化数据,利用大模型的能力和 Agent 框架来提高文本检索的准确性、效率和智能程度。
Agent 通过接口连接大模型,获得生成内容、语言理解、决策支持能力,再通过外部工具执行复杂任务,或者与环境交互。
第2章 基于大模型的Agent技术框架
-
2.1 Agent的四大要素
-
2.2 Agent的规划和决策能力
-
2.3 Agent的各种记忆机制
-
2.4 Agent的核心技能:调用工具
-
2.5 Agent的推理引擎:ReAct框架
-
2.6 其他Agent认知框架
第3章 OpenAI API、LangChain和LlamaIndex
-
3.1 何为OpenAI API
-
3.2 何为LangChain
-
3.3 何为LlamaIndex
3、项目实战
工具都会用之后,这部分要讲的就是怎样做出成功的应用,书中详细解析了 7 个项目的实战。
本书兼具理论与实践,读者可以轻松入门,快速掌握 AI Agent 的开发方法。
第4章 Agent 1:自动化办公的实现——使用Assistants API和DALL·E 3模型创作PPT
-
4.1 OpenAI公司的Assistants是什么
-
4.2 不写代码,在Playground中玩Assistants
-
4.3 Assistants API的简单示例
-
4.4 创建一个简短的虚构PPT
第5章 Agent 2:多功能选择的引擎——通过Functions Calling调用函数
-
5.1 OpenAI中的Functions
-
5.2 在OpenAI Playground中定义Function
-
5.3 用Assistants API来实现Functions Calling
-
5.4 用ChatCompletion API来实现Tool Calls
第6章 Agent 3:推理与行动的协同——使用LangChain中的ReAct框架实现自动定价
-
6.1 复习一下ReAct推理框架
-
6.2 LangChain中ReAct Agent 的实现
-
6.3 LangChain中的工具和工具包
-
6.4 通过create_react_agent创建鲜花定价Agent
-
6.5 深挖AgentExecutor的运行机制
第7章 Agent 4:计划和执行的解耦——使用LangChain中的Plan-and-Execute智能调度库存
-
7.1 Plan-and-Solve策略的提出
-
7.2 LangChain中的Plan-and-Execute Agent
-
7.3 用Plan-and-Execute Agent实现物流管理
-
7.4 从单Agent到多Agent
第8章 Agent 5:知识的提取与整合——使用Llama Index实现检索增强生成Agent
-
8.1 何为检索增强生成
-
8.2 RAG和Agent
-
8.3 用LlamaIndex的ReAct Agent来实现花语秘境财报检索
第9章 Agent 6:GitHub的网红聚落——AutoGPT、BabyAGI、CAMEL和Generative Agents
-
9.1 AutoGPT
-
9.2 BabyAGI
-
9.3 CAMEL
第10章 Agent 7:多Agent系统框架——AutoGen和MetaGPT
-
10.1 AutoGen
-
10.2 MetaGPT
有需要《大模型RAG实战:RAG原理、应用与系统构建》完整版书PDF,可以微信扫描下方二维码,立即免费领取!