Github 7700 star:UFO³让 AI 能指挥你所有设备

导读

如果你今天让一个大模型帮你“处理一件事”,它通常只能在一个设备上执行——要么是电脑,要么是手机,要么是云端服务器。换个设备,就像换了一个世界:数据不能共享、执行不能衔接、任务常常得“手动接力”。

这种割裂让本该聪明的 AI 变得十分笨拙:自动化流程卡在不同平台之间,跨终端协作需要人工指挥,智能体在设备间迁移时更是困难重重。

那有没有可能,让 AI 像指挥一个“星系”一样调动你所有的设备?让桌面、服务器、手机、边缘设备都成为一个统一“智能织网”的一部分?

这篇论文提出了一个大胆的答案:UFO³

研究者希望让大模型不再是一个孤立的智能体,而是一个能操纵整个设备星系的“总指挥官”,实现真正意义上的跨设备协作。他们提出了一种叫 TaskConstellation(任务星座) 的新机制,让跨设备任务像星图一样被动态编排,让“分布式智能体”第一次变得如此自然、可靠与灵活该项目一上线就在Github中收获了7700个star,受到了社区极大的关注

原文内容相当丰富(共56页),远超本篇所能涵盖的篇幅。我们在仅做高度凝练后的解读,为大家呈现核心脉络与关键insight。强烈推荐感兴趣的读者阅读论文原文,或访问项目的 GitHub 页面亲自体验完整内容,相信会有更多收获

图1|UFO³ “数字智能体星系”。一个自然语言意图会被拆解成可动态演化的“任务星座”(DAG),并交由多种异构设备协同执行

论文出处:arXiv2025

论文标题:UFO3: Weaving the Digital Agent Galaxy

论文作者:Chaoyun Zhang, Liqun Li, He Huang, Chiming Ni, Bo Qiao, Si Qin, Yu Kang,Minghua Ma, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang

论文链接:https://arxiv.org/pdf/2511.11332

Github:https://github.com/microsoft/UFO/

在现实中,每个设备都有自己的系统、权限、网络环境和执行节奏。

 原有的智能体框架往往只管单一机器:遇到跨平台任务就束手无策;

 数据依赖拼不起来;

 执行失败也无法自动接续;

 更别提在不同设备间动态调度资源。

研究者敏锐地意识到:这不是“功能问题”,而是“结构问题”。

如果 AI 没有一个统一的“任务世界观”,它就永远无法真正跨设备执行任务

UFO³ = 三大核心组件

1. TaskConstellation(任务星座)统一描述任务的动态 DAG,是系统大脑。

2. Constellation Orchestrator(星座调度器)负责跨设备执行计划、错误恢复、依赖解析。

3. AIP(Agent Interaction Protocol)设备之间的通信协议,保证低延迟、持续连接、可靠流式传输。

图2|UFO³ 的分层式系统架构。展示系统从任务建模、调度到多设备交互的整体结构

整个系统像一个“星系控制台”:

下达一个任务后,每台设备都会贡献自己最擅长的能力,而系统会在背后不断重绘任务蓝图,直到目标完成

可动态修改的任务星座

UFO³ 最大的突破,就是让任务不再是静态序列,而是一个 持续进化的任务图(mutable DAG)

它能做到:

 一边执行,一边修改计划

 某个子任务失败后自动重连

 根据设备响应速度与负载动态调度

 根据用户实时反馈更新任务依赖

因为跨设备环境本身就是动态的而 UFO³ 把“变化”变成设计的核心

图3|任务星座示例。展示了任务之间既包含顺序依赖,也包含可并行执行的关系

跨设备的智能体编排不再繁琐

传统跨设备框架需要繁重的工程配置,而 UFO³ 提供了一个统一的 Agent Interaction Protocol(AIP)

 设备间建立持续、可靠、低延迟的流式通道

 发送部分结果也能触发下游任务提前执行

 不同操作系统与硬件能力被抽象为“节点能力”

这个过程把所有设备拉到一个“统一语境”中,让它们可以自然协作

图4|AIP 协议栈结构。五层协议框架,为多智能体之间提供持久、可靠的跨设备通信能力

失败可恢复、执行可重写、数据可共享

论文的一个核心理念是“容错 + 动态优化”:

 执行失败不等于终止

 TaskStars 能即时替换

 Orchestrator 会探测瓶颈并重排任务

 异步结果使得整个系统更快收敛到最优路径

真实世界的设备环境一定会掉线、延迟、拥挤,而 UFO³ 的任务星座机制让系统天生具备“自愈能力”

图5|WindowsAgent 的整体架构。展示基于 UFO² 扩展实现的 Windows 端智能体结构

论文使用 NebulaBench(包含 55 个跨设备任务)对 UFO³ 进行评估。

6任务与子任务成功率。左图按任务难度统计成功率,右图按任务类别展示 UFO³ 的表现

 从图表和结果趋势可总结为:UFO³ 的任务完成率显著高于现有框架

 在多设备协作、动态恢复、异步执行等场景中表现最稳

 面对系统延迟、设备断连等挑战时“掉得最少、补得最快”

 跨桌面 + 移动 + 云端的复杂任务中保持最高稳定性

即使设备执行顺序被打乱,系统仍能根据星座图重新组织流程,顺利完成任务。这说明 UFO³ 不只是做到了“能跨设备”,而是达到了“跨设备还稳得可怕”

7NebulaBench 任务分布。左图为不同难度任务的比例,右图为每个任务所涉及的设备数量统计

UFO³ 展示了一种非常前沿的方向:智能体不再是“单机模型”,而是多设备协作的超级体

大模型变成了一个可以调度你所有设备、资源与能力的“跨终端指挥官”。对于未来的具身智能、多设备办公、Agent OS、甚至机器人系统,这将是一个非常关键的基础框架。

或许未来我们真正面对的不是一个模型,而是一整个“智能设备星系”。

你觉得,AI 能否真的替你掌控所有设备,变成你的“数字总管家”

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值