阿里深夜开源图像编辑神器Qwen-Image-Edit:20B模型实现语义与外观双重控制

部署运行你感兴趣的模型镜像

今天凌晨,阿里通义千问正式开源图像编辑模型 Qwen-Image-Edit。

它基于此前的 20B 参数 Qwen-Image 继续训练,将复杂文字渲染与图像编辑整合到一个统一框架里,重点补齐了“图中可编辑文字”“高层语义编辑”“外观级细节编辑”等能力,从而把生成与编辑打通在同一条工作流内。

目前,官方博客与模型页均已上线,用户可通过 Hugging Face、ModelScope平台获取模型权重,或通过Qwen Chat的“Image Editing”功能在线体验。阿里还提供了 ComfyUI 原生支持和详细技术文档,助力开发者快速集成。

Qwen-Image-Edit 继承了 Qwen-Image 的核心优势,在文本渲染能力上实现进一步升级。它支持直接在图像中添加、删除或修改文本,同时保留原有字体、大小和风格。

图片

在应用场景上,Qwen-Image-Edit 展现出多维度能力:

原创 IP 编辑:基于品牌吉祥物生成系列表情包,保持角色一致性;

视角转换:实现物体 90 度或 180 度旋转,生成背面视图;

风格迁移:将肖像转换为吉卜力等艺术风格;

精准元素编辑:添加、删除或修改特定元素而不影响其他区域。

总的来说,Qwen-Image-Edit 主要在两个层面发力:一是语义级编辑,能够在不破坏主体一致性的前提下完成物体结构改变、姿态调整、风格替换以及概念化修改。如下图的 IP 编辑案例:

图片

二是外观级编辑,包括增删改、抠换、局部重绘、清晰度与质感增强等。值得关注的是,它把 Qwen-Image 的中文文本渲染长项延展到编辑环节,实现图中原生文字的精确替换与重排,这对电商海报、信息图、品牌字体统一有直接价值。

图片

它能处理多行布局、段落级文本生成以及书法对联等复杂排版需求,解决了以往 AI 图像模型中文字生成模糊、错位的问题。

核心技术创新方面,团队采用双重编码机制,在处理图像编辑任务时,输入图像的同时通过 Qwen2.5-VL 模型进行语义编码,提取高层场景和对象关系特征;同时经由变分自编码器进行重建编码,保留底层视觉细节,如纹理和颜色等。

这种机制使模型在执行编辑指令时,既能理解语义意图,又能保持视觉保真度。例如,调整人物姿态的同时保持人物身份和背景一致,或在添加元素时生成逼真的反光效果。

过去一年,大模型的图像生成提升很快,但可控编辑一直是门槛:一方面是中文文字可读性差,另一方面是角色一致性和局部控制不够稳定。Qwen-Image 在 8 月初开源时就把“文本直出与中文长段渲染”作为核心卖点,编辑版则把同等文字能力搬进了编辑链条,叠加主体一致性的示例,专注于“把图改对”的能力。

官方案例显示,该模型能轻松将海报上的“Hope”替换为“Qwen”,或在书法作品中修正错误字符。通过链式编辑功能,用户可逐步修正图像中的错误,如书法作品的单字错误修正,经过多轮迭代达到理想效果。

图片

图片

那么,真实效果如何呢?算家云也来实测一波。这是一家街头咖啡店原图:

图片

增加提示词:把这家店的招牌换成中文“算家云”,保持街景风格一致。输出图片如下:

图片

接下来是难度更高的场景:语义理解 + 局部替换

输入一张野餐场景图:

图片

增加提示词:“把桌布换成绿白格子,保持光影自然”。

图片

进一步要求在桌布上加一个笔记本电脑,屏幕显示文字“算家云”:

图片

结果显示,模型能在同一画面中做多元素替换并保持协调。不过在多次修改后,光影效果的还原度还存在一定局限。

随着 AI 图像编辑技术发展,专业设计工具市场或许将面临变革。它不会在一夜之间替代 Photoshop,但会让大量以规则为主的编辑任务转移到 AI 管道中,进而推动创作团队的组织方式、素材管理与交付标准发生结构性调整。

您可能感兴趣的与本文相关的镜像

Qwen-Image

Qwen-Image

图片生成
Qwen

Qwen-Image是阿里云通义千问团队于2025年8月发布的亿参数图像生成基础模型,其最大亮点是强大的复杂文本渲染和精确图像编辑能力,能够生成包含多行、段落级中英文文本的高保真图像

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值