上一篇文章中,我分享了自己对 AI Agent 的认知转变过程。今天,我想从实战角度深入聊聊构建 AI Agent 的三个核心概念:RAG、工具调用和任务规划。这些可以说是我在过去半年开发 AI Agent 项目中最常用到的能力了。
从一个真实需求说起
还记得去年年底,我接到一个特别有意思的需求:要给公司内部开发一个技术文档助手,要求能回答任何关于公司内部技术文档的问题,并且能够执行一些简单的运维任务。
最开始的想法很简单:把所有文档扔给 GPT,让它回答问题就完了。但实际上手后,很快就发现这根本行不通:
- 文档内容太多,完全超出了模型的上下文窗口
- 文档经常会更新,每次都要重新训练太麻烦
- 很多问题需要实时查询系统状态才能回答
- 有些任务需要分步骤执行,不是单次调用能搞定的
正是这个项目,让我深入理解了 RAG、工具调用和任务规划这三个概念的重要性。
RAG:让 AI 拥有"记忆"的能力
RAG(Retrieval-Augmented Generation)说白了就是让 AI 在回答问题前,先去"查资料"。
拿我们的文档助手来说,我是这么实现的:
- 首先把所有文档切分成小块,每块大概 500-1000 字
- 用 embedding 模型把每个文档块转换成向量
- 存入向量数据库(我用的是 Milvus)
- 用户提问时:
- 先用同样的 embedding 模型处理问题
- 在向量数据库中找最相关的几个文档块
- 把这些文档块作为上下文,让 GPT 回答问题
效果立竿见影:
用户:如何在测试环境部署新服务?
Assistant:让我查一下相关文档...
根据我们的部署文档,测试环境部署新服务需
实战构建 AI Agent 的三个核心概念

最低0.47元/天 解锁文章
1131

被折叠的 条评论
为什么被折叠?



