图像编辑
文章平均质量分 93
图像编辑,2D 编辑
SP FA
我永远喜欢洛天依
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
[读论文] Text-Driven Image Editing via Learnable Regions
语言已经成为图像编辑的一种自然界面。在本文中,我们提出了一种基于文本提示的区域图像编辑方法,无需用户提供遮罩或草图。具体而言,我们的方法利用了现有的预训练文本到图像模型,并引入了一个边界框生成器,用于识别与文本提示对齐的编辑区域。我们证明了这种简单的方法可以实现与当前图像生成模型兼容的灵活编辑,并能够处理包含多对象、复杂句子或长段落的复杂提示。我们进行了广泛的用户研究,将我们的方法与最先进的方法进行比较。实验表明,我们的方法在根据语言描述操作图像时,能够以高保真度和真实性表现出竞争性性能。原创 2024-12-05 19:51:07 · 1367 阅读 · 0 评论 -
[读论文] Referring Image Editing: Object-level Image Editing via Referring Expressions
随着扩散模型(Diffusion Model)的最新进展,图像编辑领域取得了显著的突破。然而,大多数现有方法主要集中于全局或主体级别的修改,在仅依赖文本提示的情况下,对场景中特定对象进行编辑时常常面临限制,尤其当场景中存在多个共存对象时。为应对这一挑战,我们引入了一种对象级生成任务,称为,该任务使得能够使用文本提示识别和编辑图像中的特定源对象。为有效解决这一任务,我们提出了一个定制的框架,称为。该框架旨在将输入提示解耦为多个嵌入表示,并采用一种混合监督的多阶段训练策略。原创 2024-12-03 22:35:54 · 1221 阅读 · 0 评论 -
[读论文] Inversion-Free Image Editing with Natural Language
尽管基于反演的编辑技术取得了最新进展,但在扩散模型中实现文本引导的图像操作仍然具有挑战性。主要瓶颈包括:反演过程耗时难以在一致性和准确性之间取得平衡一致性模型中高效的一致性采样方法缺乏兼容性为了解决上述问题,我们首先探讨是否可以消除编辑过程中的反演步骤。我们展示了在已知初始样本的情况下,一种特殊的方差调度可以将去噪步骤简化为与多步一致性采样相同的形式。我们称之为 去噪扩散一致模型(DDCM),并指出它暗示了一种虚拟反演策略,而无需在采样中显式反演。原创 2024-12-02 20:02:04 · 1299 阅读 · 0 评论 -
[读论文] Edit One for All: Interactive Batch Image Editing
近年来,图像编辑取得了显着进步。随着人工控制的增加,现在可以以多种方式编辑图像;从在文本中指定要更改的内容,到以基于点的交互式方式直接向上拖动图像的内容。但是,大部分重点仍然是一次编辑单个图像,是否以及如何同时编辑大批量图像仍未得到充分研究。为了最大限度地减少编辑过程中的人工监督,本文提出了一种以 StyleGAN 为媒介的交互式批量图像编辑的新方法。原创 2024-12-01 09:05:18 · 1058 阅读 · 0 评论 -
[读论文] ACE: All-Round Creator and Editor Following Instructions via Diffusion Transformer
扩散模型已成为一种强大的生成技术,并被发现可应用于多种场景。目前大多数基础的扩散模型主要设计用于文本引导的视觉生成,且不支持多模态条件,这对于许多视觉编辑任务是必需的。这一限制使得这些基础扩散模型无法像 GPT-4 在自然语言处理领域那样,成为视觉生成领域的统一模型。在本研究中,我们提出了 ACE,一种全能创作和编辑模型,其在广泛的视觉生成任务中达到了与那些专家模型相当的性能。原创 2024-12-01 08:50:49 · 1453 阅读 · 0 评论
分享