如何构建高效的AI智能体

如何构建高效的智能体

Anthropic 刚刚发布了一份关于“如何构建高效智能体”的精彩指南,现翻译出来,以飨读者。

在过去的一年里,我们与来自各行各业、致力于构建大语言模型 (LLM) AI 智能体的数十个团队合作。我们发现,最成功的应用往往并未使用复杂的框架或专业库,而是采用了一些简单且可组合的模式来构建系统。

在本文中,我们将分享与客户合作并亲自构建 AI 智能体时所获得的经验,并为开发者提供构建高效 AI 智能体的实用建议。

什么是智能体?

“智能体”(Agent)的定义有多种。有些客户将其定义为可以长时间独立运行、使用各种工具来完成复杂任务的完全自主系统;另一些则将其描述为遵循预先定义工作流、较具指导性的实现方式。Anthropic 将这些不同形式都归类为智能体系统 (agentic systems),但在架构上,我们强调区分工作流 (workflows)智能体 (agents)

  • 工作流指的是通过预定义的代码路径对大语言模型和工具进行编排的系统。
  • 智能体则是通过大语言模型来自主决定工作流程和使用工具的方式,并掌控完成任务的路径。

接下来,我们会详细介绍这两种智能体系统。在附录 1(“智能体的实际案例”)中,我们还会展示客户在特定领域中如何利用这些系统获得显著价值。

使用智能体的场景

当构建基于大语言模型的应用时,我们建议先从最简单的解决方案开始,只有在确有需要时,才增加复杂性。这可能意味着完全不使用智能体系统。因为智能体系统通常需要在延迟和成本之间进行权衡,以换取更好的任务性能,必须评估这是否是可以接受的取舍。

如果有必要增加复杂性,那么工作流在可预见、可定义的任务中提供了更强的可预测性和一致性,而当需要在大规模环境中进行更灵活的模型驱动决策时,智能体则更为适用。但对许多应用而言,仅使用带检索和上下文示例的单次大语言模型调用,通常已经足够。

何时以及如何使用框架

目前市面上有许多框架可以简化智能体系统的实现,例如:

  • LangChain 的 LangGraph
  • Amazon Bedrock 的 AI Agent 框架
  • Rivet,一款可视化拖拽式的大语言模型工作流搭建工具;
  • 以及 Vellum,另一款搭建并测试复杂工作流的可视化工具。

这些框架让构建变得更简单,能够快速完成对大语言模型的调用、定义和解析工具以及链式调用等标准化底层任务。但是,它们常常额外引入抽象层,可能会遮蔽底层的提示词和响应,从而使调试难度加大。它们也可能诱使开发者增加不必要的复杂性,而实际上更简单的方案就足以应对需求。

因此,我们建议开发者从直接调用大语言模型 API 入手:许多常见模式都能通过几行代码实现。如果确实要使用某个框架,一定要理解其底层原理。对底层机制的误解是用户在使用中经常遇到的问题。

若要获取更多示例,请参阅我们的示例代码库 (cookbook)

基础构件、工作流与智能体

在本节中,我们将探讨在实际生产环境中常见的智能体系统模式。从最基础的构件——增强型大语言模型 (LLM)——开始,逐步增加复杂度,从简单的组合式工作流一路拓展到自主智能体。

基础构件:增强型大语言模型

智能体系统的基础构件是经过增

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值