AI变得更高效了!谷歌即将推出Gemini 2.5 Flash,这是一款为高性能和高效能而设计的新AI模型,将很快在其Vertex AI平台上发布。该模型专为实时应用设计,具备“动态且可控”的计算能力,使开发者能够根据查询的复杂性微调处理时间,为AI驱动的任务提供更大的灵活性和速度。谷歌表示,开发者可以在Gemini 2.5 Flash中调整速度、准确性和成本之间的平衡,为高容量、预算敏感的应用提供优化性能所需的灵活性。
Gemini 2.5 Flash作为一款经济高效的替代方案推出,旨在应对日益昂贵的旗舰AI模型,提供强劲性能的同时略微降低准确性。它被设计为一种“推理”模型,类似于OpenAI的o3-mini和DeepSeek的R1,通过花费更多时间验证响应来优先保证准确性。谷歌将2.5 Flash定位为高容量、实时任务(如客户服务和文档处理)的理想选择,使其成为注重效率应用的实用之选。
谷歌选择不为新的Gemini 2.5 Flash模型发布安全或技术报告,理由是它仍处于实验阶段。这种缺乏透明度的做法使用户和开发者更难评估模型的优势和局限性,这一举措可能会引发那些优先考虑AI责任和安全的人士的担忧。
在发布的同时,谷歌宣布计划从第三季度开始将Gemini模型的可用性扩展到本地环境。包括2.5 Flash在内的模型将通过谷歌分布式云(GDC)提供,满足对数据治理有严格需求的客户。谷歌还与英伟达合作,支持符合GDC标准的英伟达Blackwell系统,这些系统将通过谷歌或授权合作伙伴进行销售。
“这款多功能模型专为低延迟和成本效益而设计,”谷歌在其博客文章中写道。“它非常适合为响应式虚拟助手和实时摘要工具提供支持,在这些领域,可扩展的效率至关重要。”