AI领域又新增协议: AG-UI

image

随着AI的快速发展正在重塑技术生态,协议的演进速度尤为迅猛。一个令人头疼的问题浮现了:不同的AI智能体和前端应用之间就像说着不同语言的人,无法顺畅交流。开发者们需要为每个智能体单独编写接口,维护成本高昂,用户体验也参差不齐。

23ae511f4785578c23caf11413b53f89


正是在这样的背景下,2025年5月,以开发AI集成工具包CopilotKit而闻名的技术团队,正式开源发布了AG-UI (Agent-User Interaction Protocol)。其核心使命直击痛点:为AI智能体(Agent)与用户界面(UI Application)之间的实时、双向、结构化通信,制定一个专门为智能体与用户交互而设计的开放标准。

MCP 和 A2A 为 AI 智能体与工具、其他智能体之间的交互奠定标准之后,AG-UI 进一步填补了智能体与用户前端交互的空白。

什么是AG-UI协议?

image

AG-UI协议,全称Agent-User Interaction Protocol(智能体用户交互协议),是一个轻量级、事件驱动的开放协议。它充当了后端AI智能体和全栈应用之间的桥梁,是智能体与用户相遇的地方。

简单来说,AG-UI就像是一个"翻译官",让不同的AI智能体都能用统一的"语言"与前端应用对话。无论你的智能体使用什么框架开发,通过AG-UI协议,它都能与用户界面实现流畅的实时交互。

AG-UI协议的核心特性

1. 事件驱动架构

AG-UI采用事件驱动的设计理念,通过标准HTTP或可选的二进制通道流式传输单一序列的JSON事件。这些事件包括:

  • 消息事件:处理对话内容
  • 工具调用事件:执行特定功能
  • 状态补丁事件:更新应用状态
  • 生命周期信号:管理会话流程

2. 双向交互能力

与传统的单向通信不同,AG-UI支持真正的双向交互。智能体不仅能向用户发送信息,还能接收用户的实时反馈,实现真正的协作式工作流程。

3. 传输方式灵活

AG-UI不强制要求特定的传输方式,支持多种通信机制:

  • Server-Sent Events (SSE)
  • WebSockets
  • Webhooks
  • 其他自定义传输方式

这种灵活性让开发者能够根据自己的架构需求选择最适合的通信方式。

4. 兼容性强

AG-UI设计时充分考虑了兼容性问题。现有的智能体框架不需要完全重写,只需要让事件格式兼容AG-UI即可。这大大降低了迁移成本。

AG-UI 与 A2A、MCP 的关系

AG-UI专注于智能体与用户的交互层,它不与A2A(智能体到智能体协议)和MCP(模型上下文协议)等协议竞争。
实际上,这些协议是互补的:

  • AG-UI:专注于智能体与用户的深度协作,将智能体引入前端应用
  • MCP:标准化工具调用和上下文处理
  • A2A:促进智能体之间的通信和协作

一个智能体可以同时使用这三种协议:用MCP调用工具,用A2A与其他智能体通信,用AG-UI与用户协作。

接入使用 AG-UI

image

目前官方提供了两种语言的SDK 接入使用:

Python SDK:

pip install ag-ui-protocol

TS SDK

npm install @ag-ui/core

AG-UI提供了完整的开发工具链

  • 详细的文档和示例
  • 多种编程语言的SDK
  • 调试和故障排除工具
  • 与Cursor等开发工具的集成

AG-UI

AG-UI 整体架构 以及传输机制

image

事件流执行流程

image

AG-UI Chat 场景

image

最后

AG-UI不仅仅是一个协议,它是智能系统与人类交互的新兴标准。对于开发者来说,AG-UI提供了一个简洁、可扩展、优雅的基础,用于创建高质量、交互性强、可控制的智能体应用。对于用户来说,这意味着更流畅、更自然、更智能的AI交互体验。
随着AI技术的不断发展,智能体将越来越多地融入我们的日常工作和生活中。或许未来都是Agent 应用了,不是当下我们传统的App 多个分支输出端了,任何变的很简单。

AG-UI doc:

image

欢迎关注我们,后期分享更多AI最新动态和玩法👏

创作不易,欢迎一键三连👍️💗

原创作者: HaiJun-Aion 转载于: https://www.cnblogs.com/HaiJun-Aion/p/18978417
### AG-UI 的定义及其功能 AG-UI 是一种基于智能代理技术的创新性系统,旨在通过自主感知、理解和操作用户界面来实现智能化的任务处理[^1]。不同于传统的 UI 库或者交互组件集合,AG-UI 提供了一种全新的视角和技术框架,使得计算机能够像人类一样“理解”用户界面并完成复杂的任务。 #### 功能特点 AG-UI 的核心能力在于其智能代理驱动的技术架构。以下是其主要功能特性: 1. **自主感知**: 能够自动识别和分析用户界面上的各种元素,包括但不限于按钮、输入框、菜单以及其他动态内容。 2. **语义理解**: 不仅停留在简单的视觉层面,还具备深层次的理解能力,可以解析界面背后的逻辑关系以及上下文意义。 3. **自动化操作**: 基于对界面的理解,它可以独立执行一系列复杂动作序列,从而减少人工干预的需求。 4. **学习与优化**: 随着时间推移,该系统可以通过不断积累经验来自我改进,提高效率及准确性。 这些先进特性的组合让 AG-UI 成为了推动多个领域革新的关键技术之一。 #### 主要应用场景 由于上述提到的强大功能AG-UI 可广泛应用于以下几个方面: - **软件测试** 在传统方法中, 测试人员通常依赖预设脚本来验证应用程序的行为是否符合预期标准。然而这种方式存在诸多局限性, 如难以应对频繁变更的情况等。引入 AG-UI 后,则可构建更加灵活高效的解决方案——即由智能体主动探索未知区域,在发现问题的同时即时调整策略[^1]。 - **用户体验研究** 利用 AG-UI 对真实用户的模拟访问路径进行记录分析,帮助企业更好地掌握目标群体偏好趋势;同时也能快速定位那些可能引起困惑甚至阻碍正常使用的潜在障碍点。 - **辅助开发工作流** 开发者借助此平台自动生成部分样板代码片段或是初步原型设计稿,进而加快整个项目周期进度条向前推进速度。 ```python # 示例:假设我们有一个简单函数用于演示如何调用某个虚拟 API 来获取关于 AG-UI 数据的信息 def fetch_ag_ui_data(api_url): import requests try: response = requests.get(api_url) if response.status_code == 200: data = response.json() return f"Received Data: {data}" else: raise Exception(f"Failed to retrieve data with status code {response.status_code}") except Exception as e: return str(e) print(fetch_ag_ui_data('https://example.com/agui-info')) ``` 尽管 ag-Grid 和 AG-UI 名字相似,但它们属于完全不同的概念范畴。前者专注于表格控件方面的表现力提升 [^2],而后者的侧重点则放在打造全方位覆盖的人工智能支持型图形化环境之上。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值