💡 Agent可以理解为某种能自主理解、规划决策、执行复杂任务的智能体。Agent 是让 LLM 具备目标实现的能力,并通过自我激励循环来实现这个目标。它可以是并行的(同时使用多个提示,试图解决同一个目标)和单向的(无需人类参与对话)。
Agent = LLM+Planning+Feedback+Tool use
决策流程:感知(Perception)→ 规划(Planning)→ 行动(Action)
Agent创建一个目标或主任务后,主要分为以下三个步骤:
- 获取第一个未完成的任务
- 收集中间结果并储存到向量数据库中
- 创建新的任务,并重新设置任务列表的优先级
AI Agent主流框架
1. 微软的Jarvis
step1: 规划:利用好LLM 的推理规划能力,对用户输入进行任务拆解;
step2: 决策:利用LLM的决策能力,判断每个拆解的子任务,我们可以用什么方案解决
step3: 行动:通过决策得出的推荐工具(API,model,插件)去解决每个问题
step4: 总结输出最终解决方案和结果给用户
缺点:需要频繁调用LLM,token数量