导读
如果你今天让一个大模型帮你“处理一件事”,它通常只能在一个设备上执行——要么是电脑,要么是手机,要么是云端服务器。换个设备,就像换了一个世界:数据不能共享、执行不能衔接、任务常常得“手动接力”。
这种割裂让本该聪明的 AI 变得十分笨拙:自动化流程卡在不同平台之间,跨终端协作需要人工指挥,智能体在设备间迁移时更是困难重重。
那有没有可能,让 AI 像指挥一个“星系”一样调动你所有的设备?让桌面、服务器、手机、边缘设备都成为一个统一“智能织网”的一部分?
这篇论文提出了一个大胆的答案:UFO³。
研究者希望让大模型不再是一个孤立的智能体,而是一个能操纵整个设备星系的“总指挥官”,实现真正意义上的跨设备协作。他们提出了一种叫 TaskConstellation(任务星座) 的新机制,让跨设备任务像星图一样被动态编排,让“分布式智能体”第一次变得如此自然、可靠与灵活,该项目一上线就在Github中收获了7700个star,受到了社区极大的关注。
原文内容相当丰富(共56页),远超本篇所能涵盖的篇幅。我们在仅做高度凝练后的解读,为大家呈现核心脉络与关键insight。强烈推荐感兴趣的读者阅读论文原文,或访问项目的 GitHub 页面亲自体验完整内容,相信会有更多收获

图1|UFO³ “数字智能体星系”。一个自然语言意图会被拆解成可动态演化的“任务星座”(DAG),并交由多种异构设备协同执行
论文出处:arXiv2025
论文标题:UFO3: Weaving the Digital Agent Galaxy
论文作者:Chaoyun Zhang, Liqun Li, He Huang, Chiming Ni, Bo Qiao, Si Qin, Yu Kang,Minghua Ma, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang
论文链接:https://arxiv.org/pdf/2511.11332
Github:https://github.com/microsoft/UFO/

在现实中,每个设备都有自己的系统、权限、网络环境和执行节奏。
● 原有的智能体框架往往只管单一机器:遇到跨平台任务就束手无策;
● 数据依赖拼不起来;
● 执行失败也无法自动接续;
● 更别提在不同设备间动态调度资源。
研究者敏锐地意识到:这不是“功能问题”,而是“结构问题”。
如果 AI 没有一个统一的“任务世界观”,它就永远无法真正跨设备执行任务。
UFO³ = 三大核心组件
1. TaskConstellation(任务星座):统一描述任务的动态 DAG,是系统大脑。
2. Constellation Orchestrator(星座调度器):负责跨设备执行计划、错误恢复、依赖解析。
3. AIP(Agent Interaction Protocol):设备之间的通信协议,保证低延迟、持续连接、可靠流式传输。

图2|UFO³ 的分层式系统架构。展示系统从任务建模、调度到多设备交互的整体结构
整个系统像一个“星系控制台”:
下达一个任务后,每台设备都会贡献自己最擅长的能力,而系统会在背后不断重绘任务蓝图,直到目标完成。

可动态修改的任务星座
UFO³ 最大的突破,就是让任务不再是静态序列,而是一个 持续进化的任务图(mutable DAG)。
它能做到:
● 一边执行,一边修改计划
● 某个子任务失败后自动重连
● 根据设备响应速度与负载动态调度
● 根据用户实时反馈更新任务依赖
因为跨设备环境本身就是动态的,而 UFO³ 把“变化”变成设计的核心。

图3|任务星座示例。展示了任务之间既包含顺序依赖,也包含可并行执行的关系
跨设备的智能体编排不再繁琐
传统跨设备框架需要繁重的工程配置,而 UFO³ 提供了一个统一的 Agent Interaction Protocol(AIP):
● 设备间建立持续、可靠、低延迟的流式通道
● 发送部分结果也能触发下游任务提前执行
● 不同操作系统与硬件能力被抽象为“节点能力”
这个过程把所有设备拉到一个“统一语境”中,让它们可以自然协作。

图4|AIP 协议栈结构。五层协议框架,为多智能体之间提供持久、可靠的跨设备通信能力
失败可恢复、执行可重写、数据可共享
论文的一个核心理念是“容错 + 动态优化”:
● 执行失败不等于终止
● TaskStars 能即时替换
● Orchestrator 会探测瓶颈并重排任务
● 异步结果使得整个系统更快收敛到最优路径
真实世界的设备环境一定会掉线、延迟、拥挤,而 UFO³ 的任务星座机制让系统天生具备“自愈能力”。

图5|WindowsAgent 的整体架构。展示基于 UFO² 扩展实现的 Windows 端智能体结构

论文使用 NebulaBench(包含 55 个跨设备任务)对 UFO³ 进行评估。

图6|任务与子任务成功率。左图按任务难度统计成功率,右图按任务类别展示 UFO³ 的表现
● 从图表和结果趋势可总结为:UFO³ 的任务完成率显著高于现有框架
● 在多设备协作、动态恢复、异步执行等场景中表现最稳
● 面对系统延迟、设备断连等挑战时“掉得最少、补得最快”
● 跨桌面 + 移动 + 云端的复杂任务中保持最高稳定性
即使设备执行顺序被打乱,系统仍能根据星座图重新组织流程,顺利完成任务。这说明 UFO³ 不只是做到了“能跨设备”,而是达到了“跨设备还稳得可怕”

图7|NebulaBench 任务分布。左图为不同难度任务的比例,右图为每个任务所涉及的设备数量统计

UFO³ 展示了一种非常前沿的方向:智能体不再是“单机模型”,而是多设备协作的超级体。
大模型变成了一个可以调度你所有设备、资源与能力的“跨终端指挥官”。对于未来的具身智能、多设备办公、Agent OS、甚至机器人系统,这将是一个非常关键的基础框架。
或许未来我们真正面对的不是一个模型,而是一整个“智能设备星系”。
你觉得,AI 能否真的替你掌控所有设备,变成你的“数字总管家”。

被折叠的 条评论
为什么被折叠?



