OpenAI深夜炸场:AI Agent王炸来了,能动手的时代,真的到了

如果说过去一年,我们习惯了AI的“能说会道”,那么从现在开始,请准备好迎接一个“能干实事”的AI。

北京时间7月18日凌晨,OpenAI CEO Sam Altman亲自带队直播,毫无征兆地发布了他们的重磅答卷——Agent模式

这不再是简单的聊天或搜索。这是一个全新的范式:你下达指令,AI自己打开电脑,模拟人的操作,一步步把事情办完。

一个共识是,Agent是今年AI领域最大的主题。而当定义者OpenAI亲自下场,AI“动手”的时代,被真正按下了加速键。

一、AI“打工人”上线,究竟能做什么?

发布会上,OpenAI用几个惊艳的Demo,直观地展示了Agent模式的强大。

Demo 1:策划一场完美的婚礼之行

  • 任务: 朋友要结婚,帮忙规划一下行程。要求:根据婚礼官网信息,考虑天气、场地,挑选一套符合着装要求的中高档礼服,预订酒店,并提供送礼建议。

  • AI操作:

    1. Agent模式启动,打开一个虚拟电脑环境。

    2. 首先,它用文本浏览器,高速阅读用户给的婚礼网页,抓取地点、着装要求、天气等关键信息。

    3. 接着,它切换到可视化浏览器,像人一样浏览电商网站,根据要求筛选礼服,甚至能查看图片效果。

    4. 完成服装、酒店和礼物的搜寻后,它生成了一份极其详尽的报告。里面不仅有推荐链接,甚至附上了酒店空房情况的网页截图

整个过程耗时约10分钟。相比于我们自己查资料、比对、整理,这个效率高得惊人。

Demo 2:从设计到下单,一步到位

  • 任务: 为团队的宠物狗Bernie设计一批笔记本贴纸,并下单500张。

  • AI操作:

    1. Agent直接调用终端里的图像生成API,创作了一张可爱的狗狗插画。

    2. 随后,它打开浏览器,访问贴纸定制网站Sticker Mule,上传设计图,填好数量、尺寸,并加入购物车。

    3. 最后,它停在付款页面,并向用户征求确认:“设计图OK吗?继续下单吗?需要您亲自输入信用卡信息,还是让我来?”

这个任务,从零到下单前一步,只花了7分钟。

除此之外,Agent还能连接你的Google Drive,读取文件后自动生成一份PPT;或者查询赛季日程后,制作一份带标注地图的详细旅行攻略电子表格

二、看似横空出世,实则厚积薄发

这次的Agent模式,并非凭空而来。它是OpenAI上半年两大王牌功能的融合升级:

  • Operator: 一个浏览器“操作员”,能理解图形界面并模拟鼠标点击。

  • Deep Research: 一个深度“研究员”,能阅读海量网页并生成调研报告。

OpenAI发现,用户常常希望“研究员”能动手预订,又希望“操作员”能做深度分析。于是,他们干脆将两者合二为一,并加入了强大的终端功能(可以写代码、调用API等)。

这种融合产生了奇妙的化学反应,让AI在面对复杂任务时,能智能地选择最高效的工具组合:用文本浏览器快速搜集信息,用可视化浏览器处理图像和交互,用终端完成创造和执行。

能力到底有多强?OpenAI也“轻描淡写”地秀了一下成绩: 在名为“人类的最后一场大考”的基准测试中,带工具的Agent模型得分达到了42%,比不使用工具的模型翻了一倍。在网页操作(WebArena)和电子表格操作(SpreadsheetBench)等任务上,Agent的表现已经非常接近人类水平。

这意味着,AI不再仅仅是能力的延伸,它正在成为一个与我们水平相当的“数字同事”。

三、欢迎来到与Agent共存的时代

Agent是风口,但此前的产品大多体验不佳,常因任务过长或频繁出错而被诟病为“人工智障”。

OpenAI的入局,无疑给整个赛道带来了“鲶鱼效应”。它用相对流畅的体验,宣告了Agent的可行性。但这也给所有类似Manus的创业公司,以及我们每一个普通用户,带来了新的思考。

1. 信任与安全的挑战

当AI在你看不到的虚拟机里,用你的账户登录、填写你的信息时,如何保证安全?如果它被钓鱼网站骗走了信用卡号,责任谁来承担?

Sam Altman坦诚地表示,这是一个需要整个社会共同学习、建立规范的新课题。

2. 人机关系的重塑

如果说Chat时代,我们学会了甄别AI的“花言巧语”,挑战在于信息可信度

那么在Agent时代,挑战则完全转向了AI的“手”。我们需要回答一系列新问题:

  • 我们愿意信任AI到什么程度?

  • 我们愿意把多大的权限交出去?

  • 我们的角色,从“提问者”变成了“授权者”,该如何适应?

3. 工作的未来,再次被改写

当AI能独立完成一份包含数据检索、图像设计、在线预订的复杂工作流时,白领的工作究竟是被赋能,还是被替代?

这个问题的答案,依旧在风中飘。

但可以确定的是,OpenAI这次没有再搞“Pro用户优先”的戏码,Plus和Team用户每月将可用40次。这个“量大管饱”的策略,预示着Agent将以前所未有的速度普及。

无论我们是欢迎、恐惧还是茫然,一个由Agent驱动的、更自动化的新时代,确实来了。

欢迎来到AI“动手”的时代。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值