论文解读 | OS Agents: A Survey on MLLM-based Agents for General Computing Devices Use

非常高兴有机会分享我们的最新综述《OS Agents: A Survey on MLLM-based Agents for General Computing Devices Use》。最近,由Anthropic推出的Computer Use利用基于多模态大模型的智能体操控电脑完成各种任务,让人们为之兴奋,也带动了学术界与工业界在OS Agents相关领域的研究与发展。浙江大学联合OPPO、零一万物等十个机构共同梳理了OS Agents的发展现状以及未来可能,并形成了一篇综述,旨在推动该领域的持续发展。如下是我们对论文的中文解读,更多细节欢迎访问我们的论文以及开源仓库!

论文题目:OS Agents: A Survey on MLLM-based Agents for General Computing Devices Use

论文链接:https://github.com/OS-Agent-Survey/OS-Agent-Survey

项目主页:https://os-agent-survey.github.io

研究机构:浙江大学、复旦大学、OPPO、中国科学院大学、中国科学院自动化研究所、香港中文大学、清华大学、零一万物、香港理工大学、上海交通大学

1 引言

《钢铁侠》中的贾维斯(J.A.R.V.I.S.)能够帮助托尼·斯塔克控制各种系统并自动完成任务,构建一个像这样的超级AI助手一直是人类长期以来的梦想。我们把这一类实体称为OS Agents,它们能够通过操作系统(OS)提供的环境和接口(如图形用户界面,GUI)在诸如电脑或者手机等计算设备上自动化的完成各类任务。OS Agents有巨大的潜力改善全球数十亿用户的生活,想象一个世界:在线购物、预订差旅等日常活动都可以由这些智能体无缝完成,这将大幅提高人们的生活效率和生产力。过去,诸如SiriCortanaGoogle Assistant 等AI助手,已经展示了这一潜力。然而,由于模型能力在过去较为有限,导致这些产品只能完成有限的任务。幸运的是,随着多模态大语言模型的不断发展,如GeminiGPTGrokYiClaude 系列模型(排名根据2024年12月22日更新的 Chatbot Arena LLM Leaderboa

E:\Anaconda1\envs\ML-Perovskite\python.exe E:\Python_Project\1\ceshi.py 2025-03-27 17:21:46,042 - opytimizer.spaces.search — INFO — Overriding class: Space -> SearchSpace. 2025-03-27 17:21:46,042 - opytimizer.core.space — DEBUG — Agents: 20 | Size: (2, 1) | Lower Bound: [-10 -10] | Upper Bound: [10 10] | Mapping: ['x0', 'x1'] | Built: True. 2025-03-27 17:21:46,043 - opytimizer.spaces.search — INFO — Class overrided. 2025-03-27 17:21:46,043 - opytimizer.optimizers.swarm.pso — INFO — Overriding class: Optimizer -> PSO. 2025-03-27 17:21:46,043 - opytimizer.core.optimizer — DEBUG — Algorithm: PSO | Custom Parameters: None | Built: True. 2025-03-27 17:21:46,043 - opytimizer.optimizers.swarm.pso — INFO — Class overrided. 2025-03-27 17:21:46,044 - opytimizer.core.function — INFO — Creating class: Function. 2025-03-27 17:21:46,044 - opytimizer.core.function — DEBUG — Function: sphere | Built: True. 2025-03-27 17:21:46,044 - opytimizer.core.function — INFO — Class created. 2025-03-27 17:21:46,044 - opytimizer.opytimizer — INFO — Creating class: Opytimizer. 2025-03-27 17:21:46,044 - opytimizer.opytimizer — DEBUG — Space: <opytimizer.spaces.search.SearchSpace object at 0x000001A8FFDCCF40> | Optimizer: <opytimizer.optimizers.swarm.pso.PSO object at 0x000001A8FDC79FD0>| Function: <opytimizer.core.function.Function object at 0x000001A8FDC79E80>. 2025-03-27 17:21:46,044 - opytimizer.opytimizer — INFO — Class created. 2025-03-27 17:21:46,045 - opytimizer.opytimizer — INFO — Starting optimization task. 100%|##########| 1000/1000 [00:01<00:00, 889.10it/s, fitness=6.26e-89] 2025-03-27 17:21:47,171 - opytimizer.opytimizer — INFO — Optimization task ended. 2025-03-27 17:21:47,171 - opytimizer.opytimizer — INFO — It took 1.1267361640930176 seconds. 进程已结束,退出代码为 0
03-28
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值