
谷歌正式发布了Gemini 2.5 Flash Image新模型,该模型此前在测试阶段被称为"nanobanana",为企业创意项目提供了更多选择。该模型能够快速改变图像外观,相比以往版本提供更精准的控制能力。
该模型将集成到Gemini应用中。
基于Gemini 2.5 Flash构建的这一新模型,为Gemini应用的原生图像编辑功能增加了更多能力。Gemini 2.5 Flash Image能够在不同图像间保持角色相似性,在编辑图片时具有更好的一致性。例如,用户上传宠物照片后要求模型更换背景或为狗狗添加帽子时,该模型可以完成这些操作而不会改变图片主体。
谷歌在博客文章中表示:"我们深知,在编辑自己或熟悉的人的照片时,细微的缺陷都很重要,'接近但不完全相同'的效果并不理想。因此我们的最新更新旨在让朋友、家人甚至宠物的照片看起来始终保持他们本来的样子。"
企业和个人用户此前的一个主要抱怨是,在对AI生成图像进行编辑提示时,轻微调整会过度改变照片。例如,有人指示模型移动照片中人物的位置,虽然模型按指令执行,但人物面部会被轻微改变。
在Gemini平台生成的所有图像都将包含谷歌的SynthID水印。该模型面向Gemini应用的所有付费和免费用户开放。
社交媒体热议
谷歌计划发布新图像模型的猜测在社交媒体平台上广泛传播。LM Arena用户发现了一个名为"nanobanana"的神秘新模型,正如Andressen Horowitz合伙人Justine Moore所说,该模型能够"以令人印象深刻的准确性执行复杂的多步骤指令"。
人们很快注意到nanobanana模型似乎来自谷歌,随后几位早期测试者证实了这一点。不过当时谷歌并未确认在LM Arena上对该模型的计划。
原生图像编辑功能
Gemini在3月份为其平台添加了原生AI图像编辑功能,向聊

最低0.47元/天 解锁文章
2161

被折叠的 条评论
为什么被折叠?



