如果说过去一年,我们习惯了AI的“能说会道”,那么从现在开始,请准备好迎接一个“能干实事”的AI。
北京时间7月18日凌晨,OpenAI CEO Sam Altman亲自带队直播,毫无征兆地发布了他们的重磅答卷——Agent模式。
这不再是简单的聊天或搜索。这是一个全新的范式:你下达指令,AI自己打开电脑,模拟人的操作,一步步把事情办完。
一个共识是,Agent是今年AI领域最大的主题。而当定义者OpenAI亲自下场,AI“动手”的时代,被真正按下了加速键。
一、AI“打工人”上线,究竟能做什么?
发布会上,OpenAI用几个惊艳的Demo,直观地展示了Agent模式的强大。
Demo 1:策划一场完美的婚礼之行
-
任务: 朋友要结婚,帮忙规划一下行程。要求:根据婚礼官网信息,考虑天气、场地,挑选一套符合着装要求的中高档礼服,预订酒店,并提供送礼建议。
-
AI操作:
-
Agent模式启动,打开一个虚拟电脑环境。
-
首先,它用文本浏览器,高速阅读用户给的婚礼网页,抓取地点、着装要求、天气等关键信息。
-
接着,它切换到可视化浏览器,像人一样浏览电商网站,根据要求筛选礼服,甚至能查看图片效果。
-
完成服装、酒店和礼物的搜寻后,它生成了一份极其详尽的报告。里面不仅有推荐链接,甚至附上了酒店空房情况的网页截图。
-
整个过程耗时约10分钟。相比于我们自己查资料、比对、整理,这个效率高得惊人。
Demo 2:从设计到下单,一步到位
-
任务: 为团队的宠物狗Bernie设计一批笔记本贴纸,并下单500张。
-
AI操作:
-
Agent直接调用终端里的图像生成API,创作了一张可爱的狗狗插画。
-
随后,它打开浏览器,访问贴纸定制网站Sticker Mule,上传设计图,填好数量、尺寸,并加入购物车。
-
最后,它停在付款页面,并向用户征求确认:“设计图OK吗?继续下单吗?需要您亲自输入信用卡信息,还是让我来?”
-
这个任务,从零到下单前一步,只花了7分钟。
除此之外,Agent还能连接你的Google Drive,读取文件后自动生成一份PPT;或者查询赛季日程后,制作一份带标注地图的详细旅行攻略电子表格。
二、看似横空出世,实则厚积薄发
这次的Agent模式,并非凭空而来。它是OpenAI上半年两大王牌功能的融合升级:
-
Operator: 一个浏览器“操作员”,能理解图形界面并模拟鼠标点击。
-
Deep Research: 一个深度“研究员”,能阅读海量网页并生成调研报告。
OpenAI发现,用户常常希望“研究员”能动手预订,又希望“操作员”能做深度分析。于是,他们干脆将两者合二为一,并加入了强大的终端功能(可以写代码、调用API等)。
这种融合产生了奇妙的化学反应,让AI在面对复杂任务时,能智能地选择最高效的工具组合:用文本浏览器快速搜集信息,用可视化浏览器处理图像和交互,用终端完成创造和执行。
能力到底有多强?OpenAI也“轻描淡写”地秀了一下成绩: 在名为“人类的最后一场大考”的基准测试中,带工具的Agent模型得分达到了42%,比不使用工具的模型翻了一倍。在网页操作(WebArena)和电子表格操作(SpreadsheetBench)等任务上,Agent的表现已经非常接近人类水平。
这意味着,AI不再仅仅是能力的延伸,它正在成为一个与我们水平相当的“数字同事”。
三、欢迎来到与Agent共存的时代
Agent是风口,但此前的产品大多体验不佳,常因任务过长或频繁出错而被诟病为“人工智障”。
OpenAI的入局,无疑给整个赛道带来了“鲶鱼效应”。它用相对流畅的体验,宣告了Agent的可行性。但这也给所有类似Manus的创业公司,以及我们每一个普通用户,带来了新的思考。
1. 信任与安全的挑战
当AI在你看不到的虚拟机里,用你的账户登录、填写你的信息时,如何保证安全?如果它被钓鱼网站骗走了信用卡号,责任谁来承担?
Sam Altman坦诚地表示,这是一个需要整个社会共同学习、建立规范的新课题。
2. 人机关系的重塑
如果说Chat时代,我们学会了甄别AI的“花言巧语”,挑战在于信息可信度。
那么在Agent时代,挑战则完全转向了AI的“手”。我们需要回答一系列新问题:
-
我们愿意信任AI到什么程度?
-
我们愿意把多大的权限交出去?
-
我们的角色,从“提问者”变成了“授权者”,该如何适应?
3. 工作的未来,再次被改写
当AI能独立完成一份包含数据检索、图像设计、在线预订的复杂工作流时,白领的工作究竟是被赋能,还是被替代?
这个问题的答案,依旧在风中飘。
但可以确定的是,OpenAI这次没有再搞“Pro用户优先”的戏码,Plus和Team用户每月将可用40次。这个“量大管饱”的策略,预示着Agent将以前所未有的速度普及。
无论我们是欢迎、恐惧还是茫然,一个由Agent驱动的、更自动化的新时代,确实来了。
欢迎来到AI“动手”的时代。