2025年11月中旬,谷歌旗下AI研发矩阵再度释放重磅成果。DeepMind正式推出第二代可扩展多世界智能体SIMA 2,其复杂游戏任务完成率实现翻倍增长,向通用人工智能迈出关键一步;与此同时,AI辅助研究工具NotebookLM完成重大功能更新,以强化的资料整合与智能分析能力,为知识工作者打造高效协作伙伴。两大产品分别在具身智能与知识服务领域实现突破,共同推动AI从技术探索走向实用化落地。
SIMA 2:Gemini赋能的"游戏通才",完成率比肩人类玩家
11月13日,DeepMind对外发布SIMA 2(Scalable Instructable Multiworld Agent),这款集成Gemini大语言模型的智能体,彻底改变了AI在虚拟环境中的交互逻辑。与2024年3月推出的初代产品相比,SIMA 2最直观的突破是任务完成率的跨越式提升——在《无人深空》《山羊模拟器3》等训练过的游戏环境中,其复杂任务成功率从31%飙升至65%,已接近人类玩家75%的基准线。
这种质变源于核心架构的重构。SIMA 2将Gemini 2.5 flash-lite模型作为推理引擎,实现了语言理解与具身技能的深度融合。与初代仅能机械执行指令不同,新一代智能体具备明确的目标拆解与推理能力。在《无人深空》的演示场景中,当接到"前往看起来像成熟番茄的房子"的指令时,它会清晰解释决策逻辑:“成熟的番茄是红色的,所以我应该去红色的房子”,这种显式推理能力正是Gemini带来的核心价值。
多模态交互能力的升级让操作更趋自然。SIMA 2不仅能理解文字和语音指令,还可解读手绘草图与emoji——当用户发送斧头与树木的表情符号时,它能精准识别"砍树"的任务需求。这种跨模态理解能力的关键,在于DeepMind成功构建了抽象符号与游戏动作之间的映射关系,让AI真正理解"工具-对象-行动"的逻辑关联。
自我改进机制的引入则大幅降低了对人类数据的依赖。SIMA 2在获取初始人类演示数据后,可通过Gemini模型自主生成新任务,并借助独立奖励系统对自身表现评分,形成"试错-学习"的闭环。这种能力在与Genie 3(DeepMind世界生成模型)结合时尤为突出,能在实时生成的全新3D环境中快速适应并完成任务。即便在未训练过的MineDojo(《我的世界》研究版)和ASKA游戏中,其成功率也较前代分别提升13%和12%,展现出可贵的知识迁移能力。
当然,SIMA 2仍存在明显局限:长期复杂任务规划能力不足、短期记忆限制了上下文理解、键鼠操作精度远逊人类,且虚拟环境中的技能如何迁移到真实世界机器人,仍是待解难题。但正如纽约大学AI研究员Julian Togelius所言,仅通过屏幕视觉信号控制多类游戏本身就是巨大突破,其"认知层+执行层"的架构思路,为具身智能发展提供了重要参考。
NotebookLM:从笔记工具到"AI研究员",重构知识工作流
在SIMA 2聚焦虚拟世界的同时,谷歌面向知识工作领域的NotebookLM完成了实用性升级。此次更新的核心是新增"深度研究"(Deep Research)工具,配合扩展的文件支持范围,将AI辅助能力从资料整理推向主动调研的新高度。
"深度研究"功能彻底改变了传统网络调研模式。用户只需输入研究问题,工具便会自动制定调研计划并主动爬取权威资源,几分钟内即可生成结构化调研报告,内容涵盖核心结论、关联文献、数据来源等关键信息,且可直接嵌入笔记中。针对不同需求,用户还可在"深度研究"与"快速研究"两种模式间切换——前者适合学术论文、行业分析等复杂场景,后者则满足即时信息检索需求,实现调研效率的精准匹配。
文件处理能力的扩展进一步打破了信息孤岛。升级后的NotebookLM支持上传Google表格、Google Drive文件URL、PDF及Microsoft Word文档,用户可批量导入云盘文件,轻松实现表格数据总结、多格式文档对比等操作。这一改进解决了此前多源资料整合繁琐的痛点,尤其适合需要处理大量文献的科研人员和行业分析师。
此次更新是NotebookLM功能迭代的延续。自2023年底上线以来,这款工具已逐步构建起完整的知识服务生态:从支持音频概览生成AI播客,到推出视频概览功能将多模态资料转化为可视化内容,再到上线移动端应用拓展使用场景,其每一步升级都紧扣"降低知识处理门槛"的核心目标。谷歌表示,新功能将在一周内面向所有用户开放,进一步深化AI对教育、科研、咨询等领域的赋能。
双轮驱动:谷歌的AI实用化布局
SIMA 2与升级版NotebookLM的同步发布,勾勒出谷歌AI发展的清晰路径:一方面通过具身智能研究探索通用AI的核心能力,另一方面以垂直工具落地提升产业价值。SIMA 2在虚拟环境中锤炼的推理、规划与迁移学习能力,未来有望通过"认知层复用"应用于机器人、工业控制等真实场景;而NotebookLM的功能升级,则直接响应了知识工作者对效率提升的迫切需求,成为AI落地的重要抓手。
从DeepMind的技术突破到谷歌Workspace的生态整合,这种"基础研究+应用落地"的双轮驱动模式,既保证了技术领先性,又避免了AI发展陷入"实验室困境"。对于用户而言,SIMA 2展现的智能潜力让人期待未来生活场景的革新,而NotebookLM带来的效率提升则已触手可及——这或许正是AI技术最动人的价值所在:既照亮远方的探索之路,又温暖当下的工作日常。
816

被折叠的 条评论
为什么被折叠?



