什么是代理型人工智能,为什么大家都在谈论它?

什么是代理型人工智能,为什么大家都在谈论它?在这里插入图片描述

显然是具有代理性质的人工智能,但这其中还有更多的内涵。根据人工智能领域的权威人士,今年是代理型人工智能的元年。你可能已经看到谷歌宣布其“代理时代”,推出了一款网页浏览研究助手和一个可以为你打电话预约美甲店和修车店的AI机器人。OpenAI的领导层将代理型人工智能称为“2025年的重大主题”,并已经推出了Operator的研究预览版,这是一个可以代表你执行任务的代理,以及“为复杂任务在互联网上进行多步骤研究”的Deep Research。微软刚刚发布了Microsoft Discover,这是一款面向科学家的企业代理型人工智能工具。而你的下一部智能手机可能会具备代理功能,可以发送定制消息、创建日历事件或整合不同应用的信息。如果你每次听到技术朋友提到代理型人工智能时都在点头微笑,别感到尴尬。这是人工智能词汇表中的一个新条目,但已经不容忽视。

“代理型人工智能是指一类设计为自主操作、感知环境、设定目标、规划行动以实现这些目标,并在无需持续人类干预的情况下执行这些计划的人工智能系统。这些系统可以根据反馈和新信息进行学习和适应。”这是谷歌的AI聊天机器人Gemini给出的定义。与生成式人工智能不同,生成式AI本质上是一种用于创建某种输出(如代码、文本、音频、图像、视频)的工具,而代理型人工智能可以自主执行用户的任务。这是对标准AI聊天机器人体验的升级。代理型AI不仅可以根据其训练材料生成响应,还可以采取额外的步骤,如进行互联网搜索并分析结果、咨询其他来源或完成另一个应用或软件中的任务。你可能听到过这个术语与AI代理互换使用,但代理型AI是一个更广泛的术语,涵盖了可能不完全自主但具有某些代理功能的技术。

所以,OpenAI认为Operator是一个AI代理,因为它具有上下文意识,可以为你执行发送短信等任务。而其Deep Research工具是代理型AI,因为它可以自主爬取网页并为用户编制报告,尽管目前其能力基本止步于此。代理型AI由更先进的推理模型(如ChatGPT o3和Gemini 2.5 Pro Preview)驱动,这些模型可以分解复杂任务并进行推理。这使得像ChatGPT这样的大语言模型更接近模拟人脑的工作方式。塔夫茨大学工程学教授、IEEE Fellow Karen Panetta表示:“除非你不断用新信息重新训练生成式AI模型,否则它无法学习新事物。而另一种AI可以从其他例子中学习,并且可以更自主地分解任务,帮助完成更具目标导向的活动,而不是仅仅进行探索或提供信息。”当与计算机视觉(使模型能够“看到”用户计算机屏幕的技术)结合时,我们就得到了让每个人都如此兴奋的代理型AI。

代理型AI并非全新事物。自动驾驶汽车和机器人吸尘器都可以被视为代理型AI的早期例子。它们是具有自主属性的技术,依靠先进的传感器和摄像头来理解环境并做出相应反应。但代理型AI现在正迎来其高光时刻,原因有几个。最关键的是,最新模型变得更好了,也更用户友好了(尽管有时过于友好)。随着人们开始依赖像ChatGPT这样的AI聊天机器人,使用这些工具来自动化日常任务(如回复电子邮件)的兴趣日益增长。有了代理型AI,你不需要成为计算机程序员就能使用ChatGPT进行自动化操作。你可以简单地用英语告诉聊天机器人要做什么,并让它执行你的指令。至少,这是理想的情况。

OpenAI、谷歌和Anthropic等公司押注于代理型AI,因为它有潜力将技术推向超越新奇聊天机器人体验的境界。有了代理型AI,像ChatGPT这样的工具可能成为企业和个人真正不可或缺的助手。代理型AI工具可以为你在线订购杂货、浏览并购买评价最好的浓缩咖啡机,甚至研究和预订假期。事实上,谷歌已经通过其新的AI购物体验朝这个方向迈出了步伐。在商业领域,公司正在寻求代理型AI来解决客户服务查询并实时调整股票交易策略。

在野外释放自主机器人是否存在风险?当然有。让代理代表你操作,总是存在它向错误的人发送敏感电子邮件或意外进行大额购买的风险。还有责任问题。“我会因为让我的代理做某事而被起诉吗?”Panetta质疑道,“假设我担任某个组织的官员,我使用AI代理来做决策、帮助规划,然后你让该组织赔了钱。”主要的人工智能公司已经设置了防护措施,以防止AI代理失控,例如要求对敏感任务进行人工监督或批准。OpenAI表示,Operator在人类控制模式下不会截图,目前也不允许其代理进行银行交易。但当技术变得更加普及时呢?随着我们对代理型AI越来越适应,我们会变得对监督更加被动和松懈吗?

在本文前面,我们使用谷歌Gemini来帮助定义代理型AI。如果我们连简单的学习都依赖AI工具,人类会变得更笨吗?还有我们不得不给予代理的广泛数据访问权限。当然,让ChatGPT自动过滤、分类甚至删除邮件会很方便。但你想给AI公司访问你曾经发送或接收的每一封邮件的完全权限吗?还有那些没有防护措施的恶意行为者呢?Panetta警告说,利用代理型AI的网络攻击将越来越复杂。“因为现在访问强大计算能力的成本如此低廉,这意味着恶意行为者也能接触到它,”她说,“他们可以运行模拟,并能够制定出复杂的方案来入侵你的系统,或诱骗你申请这种股权贷款。”

人工智能一直是一把双刃剑,既能带来巨大的好处,也能造成严重的伤害。随着代理型AI准备进入黄金时段部署,风险也越来越高。

风帆冲浪推出SWE-1模型家族,用于高级软件工程流程在这里插入图片描述

Windsurf Editor 是一款创新的代码编辑器,它将开发者工作流程与人工智能能力相结合,提供独特的编码体验。它定位为第一款代理式集成开发环境(IDE),通过无缝融合人类与机器的努力来提升生产力。作为一款代码编辑器,它与 Visual Studio Code、VSCodium 和 Vim 等工具相媲美,为开发者与人工智能提供了和谐协作的环境。

Windsurf Editor 最新的 Wave 9 更新推出了 SWE-1 系列模型,包括 SWE-1、SWE-1-lite 和 SWE-1-mini,专为端到端软件工程工作流程设计。与传统的代码助手不同,这些模型支持整个开发工作流程,能够对不完整的项目状态进行推理,与多种开发者工具集成,并管理长期任务。SWE-1 旨在与 Claude 3.5 Sonnet 等顶级性能模型相媲美,但成本更低,目前在推广期间免费向付费用户开放。轻量级的 SWE-1-lite 模型取代了 Cascade Base,提供更高的质量,并向所有用户(包括免费用户)提供无限访问权限。SWE-1-mini 专为 Windsurf Tab 中的被动和预测任务提供快速、低延迟支持,同样免费开放。

SWE-1 引入了流程感知功能,支持实时的人机协作交互。它有效管理未完成的任务,并通过在 Windsurf 中共享时间线跟踪 IDE、浏览器和对话中的编辑、终端命令和其他用户操作,支持交互式开发。基准测试表明,SWE-1 与领先的商业模型相当,并在许多中型开源模型中表现出色,在人类参与和自主基准测试中均表现优异。

埃隆·马斯克透露他在微软的实习经历,萨提亚·纳德拉在Azure AI Foundry上推出Grok:观看在这里插入图片描述

‘在MS-DOS上编程游戏’——马斯克
由埃隆·马斯克领导的xAI旗舰GROK 3模型现已在6月期间免费提供于微软Azure平台。Azure AI Foundry还托管了其他微软合作伙伴,包括OpenAI、Meta、Hugging Face等。
在双方最新的合作中,微软首席执行官萨提亚·纳德拉与xAI的埃隆·马斯克进行了一次简短的对话,并在社交媒体上分享了这段交流。纳德拉欢迎Grok加入Azure,并表示:“非常感谢你,埃隆,来到(微软)BUILD大会。”他回忆了马斯克早期与比尔·盖茨公司的合作经历。“我知道你最初是微软的实习生,”他补充道,“你曾是WINDOWS开发者。”
“当然,你现在仍然是个狂热的PC游戏玩家,”纳德拉继续说道。他进一步邀请马斯克回顾他在微软的时光。马斯克调侃道:“啊,是的……我其实在WINDOWS之前就从DOS开始了。我曾在最早的IBM PC上使用MS-DOS工作。它最初只有128k内存,后来翻倍到256k,这在当时已经很多了。”
他补充道:“所以我在DOS上编写了视频游戏,后来在WINDOWS上,运行的是WINDOWS 3.1。”纳德拉插话道:“上次我们聊天时,你谈到了ACTIVE DIRECTORIES的复杂性,很高兴你能参加我们的开发者大会。显然,对我们来说最令人兴奋的是在AZURE上推出GROK。”
他继续说道:“我知道你对AI的未来有着深刻的愿景,这也是你构建它的原因。这是一系列兼具响应性和推理能力的模型,你还有一个非常令人兴奋的路线图。”纳德拉问马斯克:“请告诉我们一些你的愿景,你正在推动能力和效率的双重提升。”
这位亿万富翁回答道:“GROK 3.5试图从第一性原理进行推理。如果你试图找到基本真理,那么它归结为最有可能正确的公理元素,并从中推理。”马斯克继续说道:“GROK 3.5的重点是基础物理学,并将物理工具应用于所有推理过程中,以追求最小误差的真理。”

另见:埃隆·马斯克同意萨提亚·纳德拉关于AI影响的推文;网友用搞笑表情包表示“坚决反对”
另见:‘这是非法的,’埃隆·马斯克在推特上抨击萨提亚·纳德拉,指责微软游戏涉嫌的招聘行为

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值