[datawhale202405]从零手搓大模型实战：TinyAgent

最新推荐文章于 2025-04-28 11:47:26 发布

SheltonXiao

最新推荐文章于 2025-04-28 11:47:26 发布

阅读量1.2k

点赞数 25

分类专栏：笔记学习文章标签： python 语言模型

本文链接：https://blog.youkuaiyun.com/qq_40990057/article/details/139182933

版权

TinyAgent项目实现了一个简单的Agent智能体，主要是实现了ReAct策略（推理+调用工具的能力），及封装了一个Tool。

项目实现有一定的疏漏。为了正确运行代码，本次对代码Agent部分进行了简单修改（完善ReAct prompt及LLM的多次循环调用）。

1 绪论

Agent是人工智能中一个广为人知的概念，指代理人类完成部分工作的AI程序。

LLM Agent是利用LLM构建Agent，比较受到广泛认可的方式是使用LLM作为Agent的大脑，让其自主规划、利用工具来完成人类指定的任务。如下图所示，图片出自The Rise and Potential of Large Language Model Based Agents: A Survey。

Conceptual framework of LLM-based agent with three components: brain, perception, and
action

关于Agent有很多有名的项目，除了单Agent之外，Multi-agent也是目前一个比较流行的研究方向（simulated agent society）。
请添加图片描述

ReAct是一种prompt策略，它将CoT（思维链策略）和action（操作工具）结合，使LLM能够实时规划和调整操作工具的策略，从而完成较复杂的任务。下图出自ReAct project。

之前简单玩过Langchain和CrewAI的agent，都是ReAct策略的agent，简单理解agent是prompt-based的role+tool use，其中tool use借助ReAct实现

所以，手搓Agent需要完成

项目由三大部分构成

代码详见tinyAgent/Agent.py，下为笔记

有两大部分组成

prompt：分为两块，一块是tool描述的模板，一块是ReAct的模板
- tool描述：由三个部分组成，tool唯一名name_for_model，tool描述（name_for_human工具人类名，description_for_model工具功能），调用tool所需要生成的格式及参数（JSON格式，指定parameters）。
  其中tool唯一名和调用tool所需要生成的格式及参数是decode LLM的回复时需要的，tool描述是方便LLM理解这个工具是干什么的（这个在多工具时很重要）
```
{name_for_model}: Call this tool to interact with the {name_for_human} API. What is the {name_for_human} API useful for? {description_for_model} Parameters: {parameters} Format the arguments as a JSON object.
```
- ReAct策略：规定了由Question，Thought，Action，Action Input， Observation构成，并且从思考动作到观测这个步骤可以重复多次。这个是ReAct的核心。
Agent：
- LLM调用：build_system_input构建调用LLM所需的prompt，text_completion调用LLM生成回复。只执行了两次调用
- 工具调用：parse_latest_plugin_call解析/解码LLM回复中关于调用工具的部分，确定调用的tool唯一名和调用tool的参数；call_plugin调用工具得到结果。
  疑问：parse_latest_plugin_call没有用正则，而使用的字符串遍历，是出于什么考虑呢?