北京时间今天凌晨,谷歌 I/O 2025 如期举行,再次成为全球开发者与 AI 从业者瞩目的焦点。谷歌在这次大会上,首次将 AI 技术深度融入操作系统、硬件及生态,重构着科技的底层逻辑。而这一切正以 AI 为圆心,通过六大维度展现得淋漓尽致。
【图片来源于网络,侵删】
Gemini全面升级
首先是大模型升级带来的深度思考革命。
Gemini 2.5 Pro 新增了“深度思考”((Deep Think)模式,实现了多假设推理、思维链展示。并在数学竞赛 USAMO 得分提升至40.4%,在 LiveCodeBench 上也取得了领先,并在测试多模态推理的 MMMU 上获得了 84.0% 的分数。
【图片来源于网络,侵删】
它的应用场景十分广泛,无论是代码生成、复杂任务处理,还是多模态交互,Gemini 2.5 Pro 都能大显身手。比如在 3D 网页设计自动化方面,它能快速生成复杂的设计代码,为开发人员节省大量时间。
在多模态交互中,它能够实现音视频同步生成,为用户带来全新的体验。
除此之外,谷歌也同步升级了轻量级模型 Gemini 2.5 Flash,升级后的推理效率大幅提升,且成本降低,适用于边缘设备实时响应。
多模态生成工具
在多模态生成工具方面,谷歌推出了涵盖图像到视频的最新模型。
Veo 3 作为首个支持音画同步生成的视频模型,可添加环境音效、角色对话及口型同步,这对于影视制作行业来说无疑是一场革命。
【图片来源于网络,侵删】
图像生成方面则推出了 Imagen 4 模型,图像生成速度提升 10 倍,分辨率达 2K,细节精度显著增强(如织物纹理、动物毛发)。
Imagen 4 的细节精度提升,2K 分辨率与 10 倍速生成能力,为广告与设计行业注入了新的活力。
而 Flow 更是实现了 AI 电影制作全流程覆盖,从脚本到特效一键生成,极大提高了创作效率。
Agent生态
在智能体(Agent)生态方面,谷歌表示,Project Mariner 已大幅更新其工作方式,允许代理一次处理近十二项任务,目前正在向用户推出。
另外,低延迟多模态人工智能体验 Project Astra 将为搜索、Gemini AI 应用和第三方开发者的产品提供一系列新体验,实现跨设备记忆与实时视频理解。
AI原生操作系统与硬件整合
谷歌还展示了一系列新的 AI 硬件,头显 XR 与眼镜,这些新型硬件都是以其“Android XR”操作系统为基础开发构建。Android XR 是谷歌与高通、三星合作,专为扩展现实(XR)设备的开发平台。
【图片来源于网络,侵删】
Google 与中国科技企业 XREAL 宣布建立深度战略合作关系,并联合推出全球首款专为 Android XR 平台设计的高端 AR 眼镜——Project Aura。该眼镜运用了光学透视(OST)技术,这标志着 AR 行业正式进入了“安卓时代”。
同时,谷歌还发布了名为 Google Beam 的新产品。它是一个 AI 驱动的视频通信平台,让人们的视频感觉如同面对面聊天。它是谷歌 3D 视频会议系统项目 Starline 技术的升级版。
谷歌通过硬件与 AI 的结合,构建了一个完整的闭环,向着下一代人机交互入口发起了有力的冲击。
搜索与生产力工具革命
而在搜索与应用的 AI 化方面,谷歌同样带来了深刻的变革。
引入AI模型的谷歌搜索将提供“AI mode”"AI Search“功能。在AI Mode下,用户可以通过语音、文字、图片等多模态方式输入搜索问题,搜索引擎会自动分解查询意图,生成对应的答案,可以用在制定旅游行程、购物建议、编程指南等生活场景中。
【图片来源于网络,侵删】
此外,AI Mode 将支持一系列全新的功能,比如:深度搜索(Deep Search)、实时互动搜索(Search Live)。
Deep Search 可以支持 AI 模型自动发起上百次搜索,跨领域整合信息并生成引用详尽的专家级报告,节省大量人工研究时间。
Search Live 则基于 Gemini 模型和 Live API 技术,支持实时视频交互,通过摄像头实现 “场景问答”,在旅游、教育等垂直领域展现出了强大的赋能作用。
除了上述更新,谷歌还公布了 AI Ultra 计划,月费 249 美元:包含 Veo 3、Gemini 2.5 Pro Deep Think、30TB 云存储及优先体验权,覆盖开发者与高端用户。
同时,Android Studio、Jetpack Compose XR 等开发工具也同步升级,提升开发效率。
谷歌在 AI 生态上的布局,对整个行业产生了深远的影响。在开源与闭源的道路上,谷歌的 Gemini 与 Meta 的 LLaMA、腾讯 Hunyuan 等开源模型形成了鲜明的技术路线分化。
同时,AI 算力的平民化趋势愈发明显,阿里通义千问 API 成本的大幅降低,让更多中小开发者有机会入局,为行业的创新和发展注入了新的活力。
从模型、操作系统、硬件到生态,谷歌构建了全栈 AI 能力。谷歌 I/O 2025 为我们描绘了一个充满无限可能的未来,而我们也将在这个 AI 原生的时代,共同探索 AI 未来。