A Survey on Large Language Model based Autonomous Agents

828 篇文章

已下架不支持订阅

本文详述了基于大型语言模型(LLM)的自动代理的构建、应用和评估,探讨了角色扮演能力、人对齐、提示鲁棒性、幻觉、知识边界和效率等挑战。研究了如何利用LLM在社会科学、自然科学和工程领域的应用,并提出未来的研究方向。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文是LLM系列的文章,针对《A Survey on Large Language Model based Autonomous Agents》的翻译。

摘要

自动代理一直是学术界的一个突出研究课题。该领域先前的研究通常集中在孤立环境中训练知识有限的智能体,这与人类的学习过程有很大差异,从而使智能体难以实现类似人类的决策。最近,通过获取大量的网络知识,大型语言模型(LLM)在实现人类水平的智能方面表现出了巨大的潜力。这引发了研究基于LLM的自动代理的热潮。为了充分利用LLM的潜力,研究人员设计了适合不同应用的不同代理架构。在本文中,我们对这些研究进行了全面的调查,从整体的角度对自动智能体领域进行了系统的回顾。更具体地说,我们的重点在于构建基于LLM的代理,为此我们提出了一个统一的框架,该框架包含了以前的大部分工作。此外,我们还总结了基于LLM的人工智能代理在社会科学、自然科学和工程领域的各种应用。最后,我们讨论了基于LLM的人工智能代理常用的评估策略。在前人研究的基础上,我们还提出了该领域的一些挑战和未来方向。为了跟踪该领域并不断更新我们的调查,我们维护了一个库用于相关参考文献https://github.com/Paitesanshi/LLM-Agent-Survey.

1 引言

2 基于LLM的自动代理构建

3 基于LLM的自动代理应用

Action模块解析主流的另外一种Agent架构?案例分析:华为诺亚的盘古Agent主流的多智能体有哪些?【本文摘录自清华大学出版社:《深度学习和大模型原理与实践》】,各网站有销售,京东地址:https://item.jd.com/10130571131098.html研究内容:基于大型语言模型(LLM)的Agent的架构Agent定义Agent是什么?Agent是一种能够自主决策、采取行动以达到某种目标的实体。AI Agent的确定义:基于人工智能(尤其是大模型)技术,能够感知和理解环境,并采取行动以完成目标的智能实体。Agent能干什么?AI Agent 主要依托LLM模型和具体的业务场景来调用相应的工具来完成任务目标,智能化程度和行业贴合度会更明显。典型案例有什么?智能核保应用,如果解决方案搭载AI Agent能力,Agent具体工作:1)能自动识别业务需求,调用OCR信息抽取和结构化管理;2)构建核保决策模型;3)联合出保及费率管理等模块,快速完成核保目标。Agent和大模型LLM有什么关系?对于大模型和AI Agent 的关系,说法有很多,但总结下来我们可以得出三点:1)AI Agent 以大模型技术为驱动,大模型以AI Agent 为业务触手。2)不同的大模型应用行业应用,往往会催生不同的AI Agent。3)两者相辅相成、相得益彰,共同拓展着AI的应用边界和通用能力。总结,大模型 + 插件 + 执行流程 = Agent,图解如下: 论文地址:https://browse.arxiv.org/pdf/2308.11432.pdfA Survey on Large Language Model based Autonomous Agents本论文的Agent一种架构是什么?
03-09
### 基于大型语言模型(LLM)的Agent架构解析 #### Agent 架构概述 在现代人工智能领域,构建具备广泛适用性的智能体(Agent),尤其是那些可以执行多种任务并适应不同环境条件下的工作流程成为研究热点之一。为了实现这一目标,研究人员不仅依赖于强大的计算资源,还通过引入结构化推理机制和利用先验知识来增强智能体的能力[^2]。 #### 华为诺亚盘古Agent的特点 华为诺亚实验室推出的盘古Agent融合了先进的自然语言处理技术和多模态感知能力,旨在创建更加灵活高效的自动化解决方案。该平台支持调用语音生成、图像识别等多种类型的专家子系统,从而形成一个多维度交互界面,使机器能够在更复杂的场景下完成指定操作或提供服务[^1]。 #### 多智能体系统中的角色定位 当多个这样的高级别代理被集成到一起构成所谓的“多智能体系统”时,则可进一步提升整体性能表现。这些个体之间可以通过协作交流共享信息,在面对大规模数据集或者需要分布式决策的情况下展现出独特优势。例如,在工业制造环境中部署此类体系可以帮助优化生产流程管理;而在科学研究方面则有助于加速新药研发过程等具体环节上的突破进展[^3]。 ```python class MultiModalAgent: def __init__(self, llm_core, expert_modules): self.llm_core = llm_core # Large Language Model core component self.expert_modules = expert_modules # Dictionary of specialized modules like speech generation, image recognition etc. def process_input(self, input_data): processed_output = {} for modality, data in input_data.items(): if modality in self.expert_modules: processed_output[modality] = self.expert_modules[modality].process(data) final_response = self.integrate_responses(processed_output) return final_response def integrate_responses(self, responses_dict): integrated_result = "" for key, value in responses_dict.items(): integrated_result += f"{key}: {value}\n" return integrated_result ``` 此代码片段展示了如何设计一个多模态智能体类`MultiModalAgent`,它接收来自不同感官通道的信息作为输入,并将其传递给相应的专家模块进行处理。之后再由中心的语言大模型核芯部分负责整合所有反馈结果,最终给出综合性的答复。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值