人工智能代理(AI Agents)的演变经历了从简单的起步阶段到如今系统化的进展,这些系统结合了内部控制机制、外部语境基础以及认知输入,从而实现了更复杂和动态的交互。
大型语言模型(LLMs)在知识和推理能力方面存在固有限制。具备语言能力的人工智能代理通过将LLMs与内部记忆和外部环境连接起来,利用现有知识或现实观察来解决这些挑战。
过去的系统需要依赖人工设定规则或强化学习,而这些方法在适应新环境时往往显得困难。语言人工智能代理利用嵌入LLMs中的常识理解能力来应对新任务,从而减少对人工标注或反复试错学习的依赖。
架构演变
结合上图,大型语言模型(LLMs)根据其应用目标发挥不同的作用:
• A — 文本处理: 在自然语言处理(NLP)中,LLMs将文本作为输入并生成文本作为输出。
• B — 语言代理: 这些系统将LLMs与外部环境的反馈循环集成,将观察结果转化为文本,并利用LLMs进行决策或执行操作。
• C — 认知语言人工智能代理: 这些高级系统不仅使用LLMs进行交互,还管理内部流程,如学习和推理。
整合
结合下图,可以通过三个关键要素来理解人工智能代理: