
Google今天发布了基于上月推出的Gemini 3的快速且经济的Gemini 3 Flash模型,试图抢夺OpenAI的风头。该公司还将此模型设为Gemini应用和搜索AI模式中的默认模型。
新的Flash模型在Google宣布Gemini 2.5 Flash模型六个月后到来,提供了显著改进。在基准测试中,Gemini 3 Flash模型大幅超越其前代产品,并在某些指标上与其他前沿模型(如Gemini 3 Pro和GPT 5.2)的性能持平。
例如,它在Humanity's Last Exam基准测试中未使用工具的情况下获得了33.7%的分数,该测试旨在测试不同领域的专业知识。相比之下,Gemini 3 Pro得分37.5%,Gemini 2.5 Flash得分11%,新发布的GPT-5.2得分34.5%。
在多模态和推理基准测试MMMU-Pro中,新模型以81.2%的得分超越了所有竞争对手。
面向消费者的推广
Google正在全球范围内将Gemini 3 Flash设为Gemini应用中的默认模型,取代Gemini 2.5 Flash。用户仍可从模型选择器中选择Pro模型来处理数学和编程问题。
该公司表示,新模型擅长识别多模态内容并基于此给出答案。例如,您可以上传您的匹克球短视频并寻求技巧;您可以尝试画草图,让模型猜测您在画什么;或者您可以上传音频记录以获得分析或生成测验。
该公司还表示,该模型能更好地理解用户查询的意图,并能生成包含图像和表格等元素的更具视觉效果的答案。
您还可以在Gemini应用中使用新模型通过提示创建应用原型。
Gemini 3 Pro现已面向美国所有用户开放用于搜索,更多美国用户也可以在搜索中访问Nano Banana Pro图像模型。
企业和开发者可用性
Google指出,JetBrains、Figma、Cursor、Harvey和Latitude等公司已在使用Gemini 3 Flash模型,该模型可通过Vertex AI和Gemini Enterprise获得。
对于开发者,该公司正通过API以预览模型形式提供该模型,并在Google上月发布的新编码工具Antigravity中提供。
该公司表示,Gemini 3 Pro在SWE-bench验证编码基准测试中得分78%,仅次于GPT-5.2。它补充说,该模型非常适合视频分析、数据提取和视觉问答,由于其速度优势,适合快速且可重复的工作流程。
模型定价为每100万输入Token 0.50美元,每100万输出Token 3.00美元。这比Gemini Flash 2.5的每100万输入Token 0.30美元和每100万输出Token 2.50美元略贵。但Google声称,新模型的性能超越Gemini 2.5 Pro模型,同时速度快三倍。而且,对于思考任务,它平均使用的Token比2.5 Pro少30%。这意味着总体而言,您可能会在某些任务上节省Token数量。
Gemini模型产品主管兼高级总监Tulsee Doshi在向TechCrunch的简报会上表示:"我们将Flash定位为更实用的工作马模型。例如,即使从这个表格顶部的输入和输出价格来看,Flash从输入和输出价格角度来说都是更便宜的选择。因此,它实际上允许许多公司处理批量任务。"
自发布Gemini 3以来,在与OpenAI激烈的发布和性能竞争中,Google每天通过其API处理超过1万亿个Token。
本月早些时候,据报道,在ChatGPT的流量下降而Google在消费者市场份额上升后,Sam Altman向OpenAI团队发送了一份内部"红色警报"备忘录。此后,OpenAI发布了GPT-5.2和新的图像生成模型。OpenAI还宣传其不断增长的企业使用情况,并表示自2024年11月以来,ChatGPT消息量增长了8倍。
虽然Google没有直接谈及与OpenAI的竞争,但它表示,新模型的发布正在挑战所有公司保持活跃。
Doshi说:"整个行业正在发生的情况是,所有这些模型都在不断变得更强大,相互挑战,推动前沿发展。我认为同样令人兴奋的是,随着公司发布这些模型,我们也在引入新的基准测试和评估这些模型的新方法。这也在鼓励我们。"
Q&A
Q1:Gemini 3 Flash有什么特别之处?
A:Gemini 3 Flash是Google最新发布的快速且经济的AI模型,它在性能上大幅超越前代产品Gemini 2.5 Flash,在某些指标上与Gemini 3 Pro和GPT 5.2等前沿模型性能相当。它擅长识别多模态内容,能处理视频、图像、音频等多种输入,并生成包含图像和表格的可视化答案。
Q2:Gemini 3 Flash的价格是多少?
A:Gemini 3 Flash的定价为每100万输入Token 0.50美元,每100万输出Token 3.00美元。虽然比Gemini 2.5 Flash略贵,但它的性能超越Gemini 2.5 Pro,速度快三倍,且在思考任务中平均使用的Token比2.5 Pro少30%,总体上可能为某些任务节省成本。
Q3:普通用户如何使用Gemini 3 Flash?
A:Google已将Gemini 3 Flash设为Gemini应用中的全球默认模型,用户可以直接使用。用户可以上传视频寻求建议、画草图让模型猜测、上传音频获得分析或生成测验,还可以使用提示创建应用原型。如需处理数学和编程等复杂问题,用户仍可选择Pro模型。
632

被折叠的 条评论
为什么被折叠?



