谷歌抢跑L3级AI，Gemini连续工作40分钟，Agent自动生成评审百条创意

转载于 2025-11-19 09:25:05 发布 · 153 阅读

·

0

·

CC 4.0 BY-SA版权

原文链接：https://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==&mid=2247844793&idx=2&sn=314b1ffaf846ed4fe20d053e2e0488a5&chksm=e98deb576bb031c1ddb07e34a6f88ce368fb986e103d6f7c91d2384cc3e8fdd20c93eaf0f846&scene=126&sessionid=0

文章标签：

部署运行你感兴趣的模型镜像

henry 发自凹非寺
量子位 | 公众号 QbitAI

OpenAI定义的L3 AI，要被谷歌抢先一步了。

最新内测显示：Gemini可连续运行40分钟处理同一任务。。

在这段时间里，Gemini能根据用户输入，自动生成100+条创意，并由一组Agent对这些创意进行打分，排名，产出结构化的评审报告。

如此一来，用户不必再面对AI的草稿式输出，只需像筛选成熟方案一样，从智能体打磨后的结果中直接挑选即可，大幅减少了与单个Agent来回磨合的时间。

换句话说，你只需负责决策拍板，探索和迭代的过程，全由Agent代劳。

据悉，这种“先由点子生成器想方案，再由评审团进行竞赛式打分”的多智能体系统，在面向用户的产品中还是首次亮相。

果然，巴菲特的眼光绝对不会错——谷歌还是那个谷歌。

多智能体竞赛系统

如何让智能体不再只是“回答问题”，而是把大伙的输入“当个事办”？

谷歌的做法是把多智能体工作流、长时思考、对抗式生成三件事直接缝在一起。

本质上，这是在用“时间”换“质量”。

一句提示会在多智能体系统内部经历一个长达40多分钟的、完整的生成—竞争—筛选流程，而不是一次性吐出答案。

具体来看，Gemini for Enterprise的多智能体系统会首先接收主题与评估标准，大规模生成初始创意（100+）。

随后，多个Agent以竞赛方式对这些创意进行评分，排序。

由此，呈现给用户的不是一条回答，而是一套经过完整流程沉淀出来的结果：

约100个创意，按标准排序，并附带概述、细节、评论、完整评审记录，以及独立生成的“比赛表现报告”。

在当前预览版中，谷歌推出了两个基于此竞赛系统的应用场景：

创意生成：用户提供主题后，系统启动多智能体竞赛流程，生成并排序与主题相关的创意。
合作科研：用户指定研究主题并提供数据，由智能体通过相同机制生成和评估创意，更侧重科研类任务。

事实上，谷歌早在今年2月就发布过科研辅助类的Agent，但与这次内测的能力相比，功能规模和表现都不是一个量级。

一方面，单次推理的可持续时长直接被拉高到40分钟。

另一方面，系统在推理期间能够结合对抗式生成，产出结构化、有洞见的内容。

这不仅让Agent得以承担更复杂的任务，也提升了人机协作效率。

此外，为了方便系统确认需求和节省算力，系统在正式运转前会先给出一份“计划评估项目和创意维度”的概要，只有用户确认后才开始执行任务。

除了竞赛系统，谷歌还在测试一个新的“文档对话智能体”。

它拥有独立界面，允许用户上传最大30MB的PDF文件，并直接与文档内容进行对话。

系统会把最多30MB的PDF内容整合到模型上下文中，使用户能够从长文档中提取更高质量的结论与信息。

尽管这些功能目前都集成在Gemini 企业版并仍在开发中，但我们仍可以将谷歌的这次尝试视作其向L3级人工智能产品迈进的一次重要探索。

L3 AI，谷歌先行一步

去年，OpenAI提出了五级AI分类体系，用以追踪通用人工智能（AGI）的发展。

按这一体系，去年位于L1（会话型AI）向L2（推理型AI）发展的阶段。

而今年，随着Agent技术的快速发展，L3 级代理型AI开始走上舞台。

L3的核心在于“代理能力”，即AI可以在用户授权下自主执行任务，并在多天内持续运行、适应环境变化。

可以说，L3的关键在于长时间自主运行。

这也是Gemini能够连续40分钟进行多智能体对抗式生成的意义所在：

通过长时运行、多Agent协作和企业级算力支撑，它将“在单一任务上持续工作数十分钟并迭代优化”的能力落地为可用产品，向L3的定义靠近了一步。

有网友甚至推测，照这个发展速度，明年可能就会出现能够连续工作3小时的Agent。

而另一位网友则回应到：Anthropic给的时间线是2026年连续工作8小时。

到时，人类所做的将仅是设计好问题和评估标准，其余任务都可以交给Agent 自主完成。

而随着合作科研的进一步开发，Gemini没准也能够一够L4（创新者）的门槛。

让我们拭目以待。

参考链接：

[1]https://www.testingcatalog.com/google-to-enable-research-automation-on-gemini-enterprise/

[2]https://x.com/testingcatalog/status/1990177061852328329

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

— 完 —

🔊 聊AI，当然得来量子位MEET2026智能未来大会！

张亚勤、孙茂松等首波AI行业重磅嘉宾已确认出席，还有更多嘉宾即将揭晓 👉 了解详情

📍 12月10日
📍 北京金茂万丽酒店
一键报名线下参会，期待与你共论AI行业破局之道

🌟 点亮星标 🌟

您可能感兴趣的与本文相关的镜像

Stable-Diffusion-3.5

Stable-Diffusion-3.5

图片生成

Stable-Diffusion

Stable Diffusion 3.5 (SD 3.5) 是由 Stability AI 推出的新一代文本到图像生成模型，相比 3.0 版本，它提升了图像质量、运行速度和硬件效率

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。