Lagent & AgentLego 智能体应用搭建笔记-优快云博客

本文链接：https://blog.youkuaiyun.com/m0_55546566/article/details/138106157

本文介绍了Lagent，一个轻量级的智能体框架，用于高效构建基于大语言模型的智能体，并支持多种工具如搜索和交互式环境。AgentLego则提供了模块化工具包，帮助用户快速定制智能体，提升大语言模型的能力，涉及通用能力、语音处理、图像分析等多个领域。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

为什么要有Agent？

1、Agent 理论及 Lagent&AgentLego 开源产品介绍

Lagent 是一个轻量级开源智能体框架，旨在让用户可以高效地构建基于大语言模型的智能体。同时它也提供了一些典型工具以增强大语言模型的能力。

Lagent 目前已经支持了包括 AutoGPT、ReAct 等在内的多个经典智能体范式，也支持了如下工具：

Arxiv 搜索
Bing 地图
Google 学术搜索
Google 搜索
交互式 IPython 解释器
IPython 解释器
PPT
Python 解释器

AgentLego 是一个提供了多种开源工具 API 的多模态工具包，旨在像是乐高积木一样，让用户可以快速简便地拓展自定义工具，从而组装出自己的智能体。通过 AgentLego 算法库，不仅可以直接使用多种工具，也可以利用这些工具，在相关智能体框架（如 Lagent，Transformers Agent 等）的帮助下，快速构建可以增强大语言模型能力的智能体。

通用能力	语音相关	图像处理	AIGC
计算器谷歌搜索	文本 -> 音频（TTS）音频 -> 文本（STT）	描述输入图像识别文本（OCR）视觉问答（VQA）人体姿态估计人脸关键点检测图像边缘提取（Canny）深度图生成生成涂鸦（Scribble）检测全部目标检测给定目标 SAM 分割一切分割给定目标	文生图图像拓展删除给定对象替换给定对象根据指令修改 ControlNet 系列根据边缘+描述生成根据深度图+描述生成根据姿态+描述生成根据涂鸦+描述生成 ImageBind 系列音频生成图像热成像生成图像音频+图像生成图像音频+文本生成图像