
在 11 月下旬,AI 世界围绕两个主轴高速旋转:下一代多模态模型的到来,以及大量帮助 AI 更顺滑融入现实工作场景的新工具。Google 的 Gemini 3 系列与 OpenAI 的 Codex 升级占据了绝对聚光灯,同时 Anthropic、xAI 和 Microsoft Research 则在智能体与对齐研究上不断推进。与此同时,机器人实验室、开源社区和安全团队也透露出在仿真、落地与治理上的新一轮浪潮。
主要趋势
• 多模态里程碑:Google DeepMind 发布 Gemini 3 Pro 和 Nano Banana Pro 图像模型,声称在语言、视觉与代码基准上均取得最新 SOTA。Demis Hassabis 与 Jeff Dean 强调研究、工程、基础设施的深度协作,引发主流关注。
• 代码助手升级:Sam Altman 和 OpenAI Codex 团队推出重大模型提升、扩展 Windows 支持,并预览“向像真正同事那样思考和交流的模型迈进的一步”(Greg Brockman)。开发者高度关注。
• Anthropic 的对齐与合作:发布 Claude Opus 4.5(号称最强代码与智能体模型),并公布关于强化学习“奖励漏洞”的研究,推荐使用免疫提示(inoculation prompting)。同时与 NVIDIA、微软达成重磅合作,获得数十亿美元投资。主流曝光度很高。
• 智能体模型崛起:xAI 发布 Grok 4.1 Fast,并开放 Agent Tools API 免费期;Microsoft Research 介绍小型“智能体”模型 Fara-7B,内置安全机制。此类系统能代表用户行动,引发早期采用者讨论热潮。
• 开源动能增强:Olmo 3 系列(7B/32B)登陆 Hugging Face,Segment Anything 3、DETRs 等视觉模型迭代不断。Percy Liang、Simon Willison 等推动透明数据与社区创新。关注度较小但快速成长。
• 机器人与仿真:MIT Media Lab 与 Physical Intelligence 展示生成式 3D 仿真环境(Marble)及可稳定运行数小时的叠衣机器人强化学习方案。Chelsea Finn 的 VLA 方法与李飞飞对仿真工具的强调,显示机器人领域将再度兴起。
• 安全与治理信号:OpenAI 在安全博客中强调第三方测试;Timnit Gebru 与 Margaret Mitchell 呼吁在模型开发中加入社会经济研究。关注度较低但极具关键性。
• 企业落地与主权 AI:NVIDIA 与阿联酋、沙特合作建设主权 AI 数据中心;OpenAI 宣布与阿联酋航空、富士康的战略合作;xAI 在沙特上线 Grok,引发大量讨论。主流高度关注。
值得关注的信号
• 生成式 3D 环境:研究者利用 Marble 的 3D 世界快速构建机器人与虚拟测试场景(由李飞飞关注)。
• AI 公平计划:微软研究院的 Project Gecko 旨在为肯尼亚与印度的农民提供经济、文化适配的 AI 系统。
• 神经进化书籍发布:Mel Mitchell 等发布其 MIT Press 神经进化新书的开放 HTML 版本,社区广受好评。
• ElevenLabs 峰会与黑客松:举办首届峰会、宣布全球黑客松(奖金 20 万美元),并扩展至韩国,凸显语音 AI 的创意应用。
• Perplexity 快速迭代:团队每隔数日推出金融功能——K 线图、金融查询、内联股票信息——展示 AI 搜索的高频迭代。
• Laion 支持 Olmo:将 Olmo 3 新模型整合入其数据集,并上线实时视觉模型追踪器,对监管行业意义重大但较为低调。
聚焦人物与团队
Sam Altman / OpenAI Codex
- 宣布新 Codex 模型的“重大改进”,训练速度更快、支持更好。
- 称团队是“猛兽级”,并预计 Codex 将支持大量新产品形态。
- 提到过去一年“智能单位成本下降 300 倍”,强调 AI 的快速性价比提升。
Demis Hassabis / Google DeepMind
- 解释 Gemini 3 的“成功秘诀”:研究、工程、基础设施深度协作。
- 分享 10 条关于“Drops”的技术亮点,包括 Nano Banana Pro 登顶文本生成与图像编辑榜单。
- 强调真实世界应用,如城市非正规性地图与数学研究基准,展示即时价值。
Hardmaru & Sakana AI
- 推广其在 NeurIPS 的研究(连续思维机器、分支树搜索),聚焦于推理时扩展能力。
- 与 Yann LeCun、Anima Anandkumar 举办“AI for Science: Algorithms to Atoms”活动。
- 强调开放性与进化计算方向的潜力。
接下来几周值得关注的事
近期,将有强化学习奖励漏洞与免疫提示的后续论文发布;开源社区将测试 Olmo 3 是否能挑战封闭模型;Grok 4.1 Fast 与 Fara-7B 将在企业工具链中验证智能体应用。实际应用层面,机器人仿真平台与 VLA 方法可能开始融合,主权 AI 落地将为国家级战略提供样板。同时,耀眼的模型发布与低调却关键的安全、治理与稳健性研究之间的张力将持续存在。
AI好书推荐
AI日新月异,再不学来不及了。但是万丈高楼拔地起,离不开良好的基础。您是否有兴趣了解人工智能的原理和实践? 不要再观望! 我们关于 AI 原则和实践的书是任何想要深入了解 AI 世界的人的完美资源。 由该领域的领先专家撰写,这本综合指南涵盖了从机器学习的基础知识到构建智能系统的高级技术的所有内容。 无论您是初学者还是经验丰富的 AI 从业者,本书都能满足您的需求。 那为什么还要等呢?
353

被折叠的 条评论
为什么被折叠?



