知识背景:
Agent = 大语言模型(LLM) + 观察 + 思考 + 行动 + 记忆
-
大语言模型(LLM):LLM作为智能体的“大脑”部分,使其能够处理信息,从交互中学习,做出决策并执行行动。
-
观察:这是智能体的感知机制,使其能够感知其环境。智能体可能会接收来自另一个智能体的文本消息、来自监视摄像头的视觉数据或来自客户服务录音的音频等一系列信号。这些观察构成了所有后续行动的基础。
-
思考:思考过程涉及分析观察结果和记忆内容并考虑可能的行动。这是智能体内部的决策过程,其可能由LLM进行驱动。
-
行动:这些是智能体对其思考和观察的显式响应。行动可以是利用 LLM 生成代码,或是手动预定义的操作,如阅读本地文件。此外,智能体还可以执行使用工具的操作,包括在互联网上搜索天气,使用计算器进行数学计算等。
-
记忆:智能体的记忆存储过去的经验。这对学习至关重要,因为它允许智能体参考先前的结果并据此调整未来的行动。
在MetaGPT中定义的一个agent运行示例如下:
单动作Agent
PROMPT_TEMPLATE = """
Write a python function that can {instruction} and provide two runnable test cases.
Return ```python your_code_here ``` with NO other texts,
your code:
"""
看不懂PROMPT_TEMPLATE, 去看了一下
LangChain:Prompt Templates介绍及应用_prompttemplate-优快云博客
发现
“Prompt Templates可以帮助我们指导语言模型生成更高质量的文本,从而更好地完成我们的任务。
Prompt Templates可能包含:
- 对语言模型的指令
- 一组few-shot examples,以帮助语言模型生成更好的响应
- 对语言模型的问题”。
为了透彻理解这段代码,我询问了小布,使用安第