Gemini 2.5 Flash Image企业级图像编辑一致性与精准控制升级

最新推荐文章于 2025-12-22 22:11:53 发布

原创

最新推荐文章于 2025-12-22 22:11:53 发布 · 409 阅读

·

5

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#模型优化 #图像编辑 #人工智能

谷歌正式发布了Gemini 2.5 Flash Image新模型，该模型此前在测试阶段被称为"nanobanana"，为企业创意项目提供了更多选择。该模型能够快速改变图像外观，相比以往版本提供更精准的控制能力。

该模型将集成到Gemini应用中。

基于Gemini 2.5 Flash构建的这一新模型，为Gemini应用的原生图像编辑功能增加了更多能力。Gemini 2.5 Flash Image能够在不同图像间保持角色相似性，在编辑图片时具有更好的一致性。例如，用户上传宠物照片后要求模型更换背景或为狗狗添加帽子时，该模型可以完成这些操作而不会改变图片主体。

谷歌在博客文章中表示："我们深知，在编辑自己或熟悉的人的照片时，细微的缺陷都很重要，'接近但不完全相同'的效果并不理想。因此我们的最新更新旨在让朋友、家人甚至宠物的照片看起来始终保持他们本来的样子。"

企业和个人用户此前的一个主要抱怨是，在对AI生成图像进行编辑提示时，轻微调整会过度改变照片。例如，有人指示模型移动照片中人物的位置，虽然模型按指令执行，但人物面部会被轻微改变。

在Gemini平台生成的所有图像都将包含谷歌的SynthID水印。该模型面向Gemini应用的所有付费和免费用户开放。

社交媒体热议

谷歌计划发布新图像模型的猜测在社交媒体平台上广泛传播。LM Arena用户发现了一个名为"nanobanana"的神秘新模型，正如Andressen Horowitz合伙人Justine Moore所说，该模型能够"以令人印象深刻的准确性执行复杂的多步骤指令"。

人们很快注意到nanobanana模型似乎来自谷歌，随后几位早期测试者证实了这一点。不过当时谷歌并未确认在LM Arena上对该模型的计划。

原生图像编辑功能

Gemini在3月份为其平台添加了原生AI图像编辑功能，向聊

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。