别再“手工作坊”式开发Agent了！谷歌发布“生产级”标准，一文读懂5级分类与Agent Ops！-优快云博客

Google这两天发布了最新的Agent白皮书。早在今年2月份，Google发布了第一版的Agent白皮书。

这份新白皮书和2月份发布的相比，不同之处在于，它被定位为一份正式指南，其核心目标是帮助开发人员、架构师和产品负责人从概念验证 (proofs-of-concept)阶段过渡到构建生产级的Agent系统。

相较于之前更侧重于定义概念的白皮书，这份新指南的重点是解决构建生产级系统时遇到的重大挑战，特别是围绕安全性、质量和可靠性的挑战。

今天先来大致了解一下这份新的Agent白皮书里有哪些内容。

1. 什么是AI Agent： Agent被定义为一个完整的应用程序，它结合了四个要素：

模型：核心的推理引擎。

工具：连接世界、执行操作的机制（如API、数据库）。

编排层：管理操作循环（如规划、记忆）。

部署：使其成为可靠服务的生产环境。

（通用Agent架构和组件）

2. Agent解决问题的过程：Agent通过一个五步循环来工作：

第一步，获取任务 (Get the Mission)：收到一个高层目标。

第二步，扫描场景 (Scan the Scene)：收集环境和记忆中的上下文。

思考 (Think It Through)：制定或调整一个多步骤计划。

采取行动 (Take Action)：执行计划中的一步（例如调用一个工具）。

观察与迭代 (Observe and Iterate)：观察行动结果，更新记忆，然后重复思考步骤。

3. Agent系统分类法：这份白皮书提出了一个5级分类法来界定代理的能力：

级别 0：核心推理系统（单独的LM，没有工具）。

级别 1：互联的问题解决者（能使用工具获取实时信息）。

级别 2：战略性的问题解决者（能为复杂的多步骤目标制定计划）。

级别 3：协作式多代理系统（由“专家”代理组成的团队协同工作）。

级别 4：自我进化的系统（能动态创造新工具或新代理来填补能力空白）。

4. Multi-Agent 系统

解决复杂任务的最佳方式不是构建一个Super Agent，而是采用专家团队的模式。包括使用“协调器”模式（一个“Manage” Agent分配任务）或“迭代优化”模式（一个“Generator Agent”和一个“Critic Agent”）。

5. Agent部署

这份白皮书里讨论了如何将代理部署到服务器上，例如使用Vertex AI Agent Engine或Cloud Run/GKE等容器化服务。

6. Agent Ops（Agent运维）

这是管理Agent系统“不可预测性”的结构化方法，是DevOps和MLOps的演进。

7. Agent评估

确定Agent评估指标：如目标完成率、成本。

评估方式LM-as-Judge：由于代理的输出是概率性的，不能用简单的“通过/失败”测试，而是使用一个强大的模型根据预定义的标准来评估输出质量。

8. Agent交互性

Agent与人的交互：通过聊天界面、动态UI或实时的“实时模式”进行多模态通信。

Agent之间的交互：使用 A2A（Agent2Agent）协议，代理可以通过发布“代理卡”（Agent Card）来被发现，并通过异步任务进行通信。

Agent与Money的交互: 讨论了新兴的支付协议（如AP2），以实现安全的代理交易。

9. Agent安全性

对于单个Agent，安全性是在效用和风险之间进行权衡。这份白皮书推荐采用混合方法：

确定性护栏：硬编码的规则（例如，阻止超过100美元的购买）。

基于推理的防御：使用专门的“护卫模型”来审查Agent的计划。

对于企业级安全性：

Agent身份： Agent是继人类用户和服务账户之后的第三类主体。它们需要自己可验证的身份（如SPIFFE），以实现最小权限的精细化控制。

治理：为防止“Agent sprawl”（代理泛滥），企业需要一个中央网关或控制平面来管理所有Agent的流量、身份验证和策略执行。

10. Agent学习和进化

Agent通过运行时经验（如日志、人类反馈）和外部信号（如更新的公司政策）进行学习。通过增强上下文工程（优化提示）或工具优化（动态创建新工具）来进化。

示例：

AlphaEvolve Agent：一个使用进化过程来发现和优化算法的AI Agent。

如何高效转型Al大模型领域？

作为一名在一线互联网行业奋斗多年的老兵，我深知持续学习和进步的重要性，尤其是在复杂且深入的Al大模型开发领域。为什么精准学习如此关键？

系统的技术路线图：帮助你从入门到精通，明确所需掌握的知识点。
高效有序的学习路径：避免无效学习，节省时间，提升效率。
完整的知识体系：建立系统的知识框架，为职业发展打下坚实基础。

AI大模型从业者的核心竞争力

持续学习能力：Al技术日新月异，保持学习是关键。
跨领域思维：Al大模型需要结合业务场景，具备跨领域思考能力的从业者更受欢迎。
解决问题的能力：AI大模型的应用需要解决实际问题，你的编程经验将大放异彩。

以前总有人问我说：老师能不能帮我预测预测将来的风口在哪里？

现在没什么可说了，一定是Al；我们国家已经提出来：算力即国力！

未来已来，大模型在未来必然走向人类的生活中，无论你是前端，后端还是数据分析，都可以在这个领域上来，我还是那句话，在大语言AI模型时代，只要你有想法，你就有结果！只要你愿意去学习，你就能卷动的过别人！

现在，你需要的只是一份清晰的转型计划和一群志同道合的伙伴。作为一名热心肠的互联网老兵，我决定把宝贵的AI知识分享给大家。至于能学习到多少就看你的学习毅力和能力了。

在这里插入图片描述

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传优快云，朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【`保证100%免费`】