一、核心升级
1. 模型升级
- 底层模型从 GPT-4o 升级至 o3,显著提升推理能力与任务完成稳定性。
- o3 作为 OpenAI新推出的“推理专用模型”,在数学逻辑、复杂任务分解及动态策略调整上表现更优,尤其在浏览器操作的容错率和意图理解精准度方面进步明显。
2. 功能优化
-
浏览器交互:升级后支持更持久的网页操作流程(如多步骤表单填写、跨页面导航),且减少因页面动态加载导致的流程中断问题。
-
任务成功率:官方宣称整体任务完成率提升超过 30%,回复内容结构化程度与细节完整性均有显著优化。
-

二、技术特性
1. 感知与推理架构
- 基于 CUA(计算机使用智能体) 架构,融合视觉识别(屏幕截图分析)与强化学习推理能力,无需依赖 API 即可直接操作
GUI界面。 - 采用 跨步骤状态跟踪 机制,动态结合历史操作与当前界面信息,支持复杂任务的长链条规划(例如根据用户评论筛选并预订酒店)。
2.安全性增强
- o3 模型集成专门针对计算机使用场景的微调数据集,降低非法操作(如隐私数据爬取)的执行概率。
- 强化对抗

最低0.47元/天 解锁文章
2566

被折叠的 条评论
为什么被折叠?



