Agent系列2:重磅!谷歌2025年智能体技术白皮书[付完整版pdf下载]

感兴趣的朋友可以关注公众号"XiaozhiAGI",将持续输出关于RAG、Agent、Agentic workflow、AGI等人工智能前沿技术动态、产品动态。

谷歌2025年智能体技术白皮书,关注公众号,回复'谷歌智能体'即可获取42页翻译版PDF文件。

图片

引 言

人 类 在 杂 乱 无 章 的 模 式 识 别 任 务 方 面 表 现 出 色 。 然 而 , 他 们 经 常 依 赖 于 工 具 — — 如 书 籍 、谷 歌 搜 索 或 计 算 器 — — 来 补 充 先 验 知 识 , 然 后 得 出 结 论 。 与 人 类 一 样 , 生 成 式 人 工 智 能模 型 也 可 以 训 练 使 用 工 具 来 获 取 实 时 信 息 或 建 议 现 实 世 界 的 行 动 。 例 如 , 模 型 可 以 利用 数 据 库 检 索 工 具 来 访 问 特 定 信 息 , 如 客 户 的 购 买 历 史 , 以 便 生 成 个 性 化 的 购 物 推 荐 。或 者 , 基 于 用 户 的 查 询 , 模 型 可 以 发 出 各 种API调 用 , 向 同 事 发 送 电 子 邮 件 回 复 , 或 代表 您 完 成 金 融 交 易 。 要 做 到 这 一 点 , 模 型 不 仅 需 要 能 够 访 问 一 组 外 部 工 具 , 还 需 要 能够 以 自 主 的 方 式 规 划 和 执 行 任 何 任 务 。 这 种 推 理 、 逻 辑 和 访 问 外 部 信 息 的 组 合 与 生 成式 人 工 智 能 模 型 相 关 联 , 引 发 了 代 理 的 概 念 , 即 超 越 生 成 式 人 工 智 能 模 型 独 立 能 力 的程 序 。 本 白 皮 书 将 深 入 探 讨 所 有 这 些 及 相 关 方 面 。

什 么 是 代 理 ?

在 最 基 本 的 形 式 中 , 生 成 式 人 工 智 能 代 理 可 以 被 定 义 为 一 种 试 图 通 过 观 察世 界 并 使 用 其 可 用 的 工 具 来 采 取 行 动 以 实 现 目 标 的 应 用 程 序 。 代 理 是 自 主的 , 可 以 独 立 于 人 类 干 预 而 行 动 , 特 别 是 当 它 们 被 赋 予 适 当 的 目 标 或 目 的时 。 代 理 也 可 以 主 动 采 取 行 动 来 实 现 其 目 标 。 即 使 没 有 人 类 明 确 的 指 令 集 ,代 理 也 可 以 推 理 出 下 一 步 应 该 做 什 么 , 以 实 现 其 最 终 目 标 。 虽 然 代 理 的 概念 在 人 工 智 能 中 相 当 普 遍 且 强 大 , 但 本 白 皮 书 重 点 关 注 在 发 布 时 生 成 式 人工 智 能 模 型 能 够 构 建 的 特 定 类 型 的 代 理 。为 了 理 解 智 能 体 的 内 部 运 作 , 让 我 们 首 先 介 绍 驱 动 智 能 体 行 为 、 动 作 和

决 策 的 基 础 组 件 。 这 些 组 件 的 组 合 可 以 被 描 述 为 认 知 架 构 , 并 且 通 过 这些 组 件 的 混 合 和 匹 配 可 以 实 现 许 多 这 样 的 架 构 。 专 注 于 核 心 功 能 , 智 能体 的 认 知 架 构 中 有 三 个 基 本 组 件 , 如 图1所 示 。

图片

模 型

在 代 理 的 范 围 内 , 模 型 指 的 是 将 作 为 代 理 流 程 集 中 决 策 者 的 语 言 模 型 (LM) 。 代 理 所使 用 的 模 型 可 以 是 任 何 大 小 ( 小/大 ) 的 一 个 或 多 个 LM, 这 些 LM能 够 遵 循 基 于 指 令 的推 理 和 逻 辑 框 架 , 如ReAct、 链 式 思 维 或 树 式 思 维 。 模 型 可 以 是 通 用 的 、 多 模 态 的 , 或者 根 据 您 的 特 定 代 理 架 构 的 需 求 进 行 微 调 。 为 了 获 得 最 佳 的 生 产 结 果 , 您 应 该 利 用 最 适合 您 期 望 的 最 终 应 用 程 序 的 模 型 , 理 想 情 况 下 , 该 模 型 应 该 是 在 与 您 计 划 在 认 知 架 构 中使 用 的 工 具 相 关 的 数 据 特 征 上 进 行 训 练 的 。 需 要 注 意 的 是 , 模 型 通 常 不 是 使 用 代 理 的 特定 配 置 设 置 ( 即 工 具 选 择 、 编 排/推 理 设 置 ) 进 行 训 练 的 。 然 而 , 可 以 通 过 向 模 型 提 供展 示 代 理 能 力 的 示 例 ( 包 括 代 理 在 不 同 情 境 中 使 用 特 定 工 具 或 推 理 步 骤 的 实 例 ) 来 进 一步 优 化 模 型 以 适 应 代 理 的 任 务 。

这 些 工 具

基 础 模 型 尽 管 在 文 本 和 图 像 生 成 方 面 表 现 出 色 , 但 仍 受 到 无 法 与 外 部 世 界 交 互的 限 制 。工 具填 补 了 这 一 差 距 , 使 代 理 能 够 与 外 部 数 据 和 服 务 进 行 交 互 , 同 时解 锁 了 超 出 基 础 模 型 自 身 所 能 实 现 的 一 系 列 更 广 泛 的 动 作 。 工 具 可 以 有 多 种 形式 , 复 杂 程 度 也 各 不 相 同 , 但 通 常 与 常 见 的 网 络API方 法 ( 如 GET、 POST、PATCH和 DELETE) 相 符 。 例 如 , 一 个 工 具 可 以 更 新 数 据 库 中 的 客 户 信 息 或 获取 天 气 数 据 , 以 影 响 代 理 向 用 户 提 供 的 旅 行 推 荐 。 通 过 工 具 , 代 理 可 以 访 问 和处 理 真 实 世 界 的 信 息 。 这 使 他 们 能 够 支 持 更 专 业 化 的 系 统 , 如 检 索 增 强 生 成(RAG) , 这 极 大 地 扩 展 了 代 理 的 能 力 , 超 出 了 基 础 模 型 本 身 所 能 实 现 的 范 围 。我 们 将 在 下 面 更 详 细 地 讨 论 工 具 , 但 最 重 要 的 是 要 理 解 , 工 具 在 代 理 的 内 部 能力 和 外 部 世 界 之 间 架 起 了 桥 梁 , 解 锁 了 更 广 泛 的 可 能 性 。

编 排 层

编 排 层 描 述 了 一 个 循 环 过 程 , 该 过 程 控 制 着 代 理 如 何 接 收 信 息 、 进 行 内 部 推理 , 并 利 用 该 推 理 来 告 知 其 下 一 步 行 动 或 决 策 。 一 般 来 说 , 这 个 循 环 会 持 续下 去 , 直 到 代 理 达 到 目 标 或 停 止 点 。 编 排 层 的 复 杂 性 因 代 理 和 其 执 行 的 任 务而 异 。 有 些 循 环 可 能 是 简 单 的 计 算 和 决 策 规 则 , 而 其 他 循 环 可 能 包 含 链 式 逻辑 、 涉 及 额 外 的 机 器 学 习 算 法 , 或 实 现 其 他 概 率 推 理 技 术 。 我 们 将 在 认 知 架构 部 分 讨 论 代 理 编 排 层 的 详 细 实 现 。

代 理 与 模 型

为 了 更 清 晰 地 理 解 代 理 和 模 型 之 间 的 区 别 , 请 考 虑 以 下 图 表 :

图片

认 知 架 构 : 智 能 体 如 何 运 作

想 象 一 下 一 位 在 繁 忙 厨 房 里 的 厨 师 。 他 们 的 目 标 是 为 餐 厅 顾 客 创 作 美 味 的菜 肴 , 这 涉 及 到 一 些 规 划 、 执 行 和 调 整 的 循 环 。他 们 收 集 信 息 , 比 如 顾 客 的 订 单 以 及 食 品 储 藏 室 和 冰 箱 里 的 食 材 。

• 他 们 根 据 刚 刚 收 集 到 的 信 息 , 对 能 够 创 作 哪 些 菜 肴 以 及 风 味 特 点 进 行 一 些内 部 推 理 。

• 他 们 采 取 行 动 来 制 作 菜 肴 : 切 碎 蔬 菜 、 调 配 香 料 、 煎 肉 。

在 这 个 过 程 的 每 个 阶 段 , 厨 师 都 会 根 据 需 要 进 行 调 整 , 随 着 食 材 的 消 耗 或 收 到顾 客 的 反 馈 而 完 善 他 们 的 计 划 , 并 利 用 之 前 的 一 系 列 成 果 来 确 定 下 一 步 行 动 计划 。 这 种 信 息 收 集 、 规 划 、 执 行 和 调 整 的 循 环 描 述 了 一 种 独 特 的 认 知 架 构 , 厨师 利 用 它 来 实 现 自 己 的 目 标 。就 像 厨 师 一 样 , 代 理 可 以 使 用 认 知 架 构 来 达 到 最 终 目 标 , 通 过 反 复 处 理 信 息 、 做出 明 智 的 决 策 , 并 根 据 之 前 的 输 出 优 化 下 一 步 行 动 。 代 理 认 知 架 构 的 核 心 是 编 排层 , 负 责 维 护 内 存 、 状 态 、 推 理 和 规 划 。 它 利 用 迅 速 发 展 的 提 示 工 程 领 域 及 相 关框 架 来 指 导 推 理 和 规 划 , 使 代 理 能 够 更 有 效 地 与 环 境 互 动 并 完 成 任 务 。 在 语 言 模型 的 提 示 工 程 框 架 和 任 务 规 划 方 面 的 研 究 正 在 迅 速 发 展 , 产 生 了 各 种 有 前 景 的 方法 。 虽 然 这 不 是 一 个 详 尽 的 列 表 , 但 以 下 是 截 至 本 出 版 物 发 布 时 最 流 行 的 框 架 和推 理 技 术 中 的 一 些 :

•ReAct 是 一 个 提 示 工 程 框 架 , 为 语 言 模 型 提 供 了 一 个 思 维 过 程 策 略 , 以 便 对 用户 查 询 进 行 推 理 并 采 取 行 动 , 无 论 是 否 有 上 下 文 示 例 。ReAct 提 示 已 被 证 明 优于 几 个 最 先 进 的 基 准 , 并 提 高 了 大 型 语 言 模 型 的 人 类 互 操 作 性 和 可 信 度 。

  • 思 维 链(CoT) , 一 种 提 示 工 程 框 架 , 通 过 中 间 步 骤 实 现 推 理 能 力 。 思 维 链 有 各 种子 技 术 , 包 括 自 一 致 性 、 主 动 提 示 和 多 模 态 思 维 链 , 它 们 各 自 在 特 定 应 用 中 都 有 其优 势 和 劣 势 。

• 思 维 之 树(ToT) , 一 个 非 常 适 合 探 索 或 战 略 前 瞻 任 务 的 提 示 工 程 框 架 。 它 概 括了 思 维 链 提 示 , 并 允 许 模 型 探 索 各 种 思 维 链 , 这 些 思 维 链 可 作 为 使 用 语 言 模 型 进行 一 般 性 问 题 解 决 的 中 间 步 骤 。代 理 可 以 使 用 上 述 推 理 技 术 之 一 , 或 者 许 多 其 他 技 术 , 为 给 定 的 用 户 请 求 选 择 下 一个 最 佳 行 动 。 例 如 , 让 我 们 考 虑 一 个 代 理 , 它 被 编 程 使 用ReAct框 架 为 用 户 查 询 选 择正 确 的 行 动 和 工 具 。 事 件 的 顺 序 可 能 是 这 样 的 :

1. 用 户 向 代 理 发 送 查 询

2. 特 工 启 动 “ ReAct” 序 列

3. 代 理 向 模 型 提 供 一 个 提 示 , 要 求 其 生 成 接 下 来 ReAct 步 骤 中 的 一 个 以 及 相 应 的

输 出 :

a. 问 题 : 来 自 用 户 查 询 的 输 入 问 题 , 与 提 示 一 起 提 供

b. 想 法 : 模 型 对 于 接 下 来 应 该 做 什 么 的 想 法

c. 行 动 : 模 型 关 于 接 下 来 采 取 何 种 行 动 的 决 定

这 就 是 工 具 选 择 可 能 发 生 的 地 方 。例 如 , 一 个 动 作 可 以 是 [航 班 、 搜 索 、 代 码 、 无 ]之 一 , 其 中 前 三 个 表 示 模 型 可以 选 择 的 已 知 工 具 , 最 后 一 个 表 示 “ 无 工 具 选 择 ” 。

d. 动 作 输 入 : 模 型 关 于 向 工 具 提 供 何 种 输 入 ( 如 果 有 的 话 ) 的 决 定

e. 观 察 : 行 动 /行 动 输 入 序 列 的 结 果

i. 这 种 想 法 /行 动 /动 作 输 入 /观 察 可 以 根 据 需 要 重 复 N 次

f. 最 终 答 案 : 模 型 为 原 始 用 户 查 询 提 供 的 最 终 答 案

4. ReAct 循 环 结 束 , 并 向 用 户 返 回 最 终 答 案 。

图片

如 图2 所 示 , 模 型 、 工 具 和 代 理 配 置 协 同 工 作 , 根 据 用 户 的 原 始 查 询 为 用 户 提 供 基 于 事实 的 、 简 洁 的 响 应 。 虽 然 模 型 本 可 以 根 据 其 先 验 知 识 猜 测 一 个 答 案 ( 幻 觉 ) , 但 它 却 使用 了 一 个 工 具 ( 航 班 ) 来 搜 索 实 时 的 外 部 信 息 。 这 些 额 外 的 信 息 被 提 供 给 模 型 , 使 其 能够 基 于 真 实 的 事 实 数 据 做 出 更 明 智 的 决 策 , 并 将 这 些 信 息 总 结 反 馈 给 用 户 。

总 之 , 代 理 响 应 的 质 量 可 以 直 接 与 模 型 对 这 些 各 种 任 务 进 行 推 理 和 行 动 的 能 力联 系 起 来 , 包 括 选 择 正 确 工 具 的 能 力 , 以 及 这 些 工 具 定 义 得 有 多 好 。 就 像 厨 师用 新 鲜 食 材 精 心 烹 饪 菜 肴 并 关 注 顾 客 反 馈 一 样 , 代 理 依 靠 合 理 的 推 理 和 可 靠 的信 息 来 提 供 最 佳 结 果 。 在 下 一 节 中 , 我 们 将 深 入 探 讨 代 理 与 新 鲜 数 据 连 接 的 各种 方 式 。

工 具 : 我 们 通 向 外 部 世 界 的 钥 匙

虽 然 语 言 模 型 在 处 理 信 息 方 面 表 现 出 色 , 但 它 们 缺 乏 直 接 感 知 和 影 响 现 实 世 界 的能 力 。 这 限 制 了 它 们 在 与 外 部 系 统 或 数 据 交 互 的 情 况 下 的 实 用 性 。 这 意 味 着 , 从某 种 意 义 上 说 , 语 言 模 型 的 能 力 取 决 于 它 从 训 练 数 据 中 学 到 了 什 么 。 但 无 论 我 们向 模 型 输 入 多 少 数 据 , 它 们 仍 然 缺 乏 与 外 部 世 界 交 互 的 基 本 能 力 。 那 么 , 我 们 如何 能 够 赋 予 我 们 的 模 型 与 外 部 系 统 进 行 实 时 、 上 下 文 感 知 交 互 的 能 力 呢 ? 函 数 、扩 展 、 数 据 存 储 和 插 件 都 是 为 模 型 提 供 这 种 关 键 能 力 的 方 式 。虽 然 工 具 有 许 多 不 同 的 名 称 , 但 它 们 是 在 我 们 的 基 础 模 型 和 外 部 世 界 之 间 建 立 联系 的 桥 梁 。 这 种 与 外 部 系 统 和 数 据 的 联 系 使 我 们 的 代 理 能 够 执 行 更 广 泛 的 各 种 任务 , 并 以 更 高 的 准 确 性 和 可 靠 性 执 行 这 些 任 务 。 例 如 , 工 具 可 以 使 代 理 调 整 智 能家 居 设 置 、 更 新 日 历 、 从 数 据 库 中 获 取 用 户 信 息 , 或 者 根 据 特 定 的 一 组 指 令 发 送电 子 邮 件 。

截 至 本 出 版 物 发 布 之 日 , 谷 歌 模 型 能 够 与 之 交 互 的 三 种 主 要 工 具 类 型 为 : 扩 展 、函 数 和 数 据 存 储 。 通 过 为 代 理 配 备 工 具 , 我 们 为 他 们 解 锁 了 巨 大 的 潜 力 , 使 他 们不 仅 能 够 理 解 世 界 , 还 能 够 对 其 采 取 行 动 , 为 无 数 新 的 应 用 和 可 能 性 敞 开 了 大 门 。

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

谷歌2025年智能体技术白皮书,关注公众号"XiaozhiAGI",回复'谷歌智能体'即可获取完整版42页翻译版PDF文件。

XiaozhiAGI

AI时代已来临,拥抱AI,投身AI。将持续输出关于RAG、Agent、Agentic workflow、AGI等人工智能前沿技术动态、产品动态。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

txhy2018

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值