人工智能顶会CVPR2022《Few Shot Generative Model Adaption via Relaxed Spatial Structural Alignment》论文解读

Few Shot Generative Model Adaption via Relaxed Spatial Structural Alignment

1.引言

在小样本学习领域,生成模型适应性的研究对于提升模型在有限数据条件下的学习能力至关重要。传统的生成模型通常需要大量数据来训练,而在实际应用中,尤其是在特定的或者罕见的场景中,获取大量标注数据通常是不切实际的。小样本学习旨在解决这一问题,通过开发能够从少量样本中快速适应和学习的模型,来推广模型的应用范围,提高其在特定任务上的性能。有效的生成模型适应性不仅可以增强模型对新任务的快速适应能力,还能在数据稀缺的领域中发挥关键作用,如医学图像分析、生物信息学和其他需要定制化模型的应用。

面临的挑战

使用少样本的生成模型在适应性方面面临的主要挑战包括:

  1. 模型过拟合与崩溃:在极少样本的情况下(少于10个),常规的生成模型通常会产生质量较差的图像,并且容易发生早期崩溃。

  2. 身份退化和非自然失真:即使是通过对比学习提出的保持源域实例间相对距离的方法,也无法保证每个图像的固有结构,导致样本在目标域空间中漂移,最终造成身份退化和非自然的失真或纹理变化。

  3. 现有方法的局限性:尽管一些方法通过微调策略直接建模目标域的分布,或通过施加强正则化、轻微扰动网络参数、数据增强等方法来避免过拟合,但这些方法通常只适用于训练图像数量超过100的情况。

针对这些挑战,论文提出了一种新的适应性方法,即放松的空间结构对齐(RSSA),该方法利用源域图像更丰富的空间结构先验来解决生成模型的身份退化问题。

2.Relaxed Spatial Structural Alignment (RSSA)

在这里插入图片描述

Relaxed Spatial Structural Alignment (RSSA) 的详细工作原理包括以下几个关键部分:

  1. 生成模型的预训练与适应:在RSSA中,首先有一个在大规模源域数据集 D s D_s Ds上预训练的生成器 G s G_s Gs。这个生成器将从潜在空间 z ∼ p ( z ) ⊂ R d z \sim p(z) \subset \mathbb{R}^d zp(z)Rd中采样的噪声向量 z z z映射到像素空间中的生成图像 G s ( z ) G_s(z) Gs(z)。少样本适应的目标是将 G s G_s Gs从源域适应到目标域,并使用目标域中的少量样本获取目标生成器 G t G_t Gt。通常,这是通过用 G s G_s Gs 初始化 G t G_t Gt并在目标域数据集 D t D_t Dt 上微调 G t G_t Gt来完成的。

  2. 跨域空间结构一致性损失 L G s ↔ G t L_{Gs \leftrightarrow Gt} LGsGt是RSSA方法的核心,由自相关一致性损失和干扰相关一致性损失组成。这一损失函数帮助保持源域和目标域生成的图像对之间的结构一致性,通过保持图像的内在空间结构和变化趋势来解决身份退化和图像失真问题。

    1. 什么是跨域空间结构一致性损失?

      跨域空间结构一致性损失(Cross-domain spatial structural consistency loss)是为了解决少样本生成模型适应问题而提出的一种创新损失函数。这一损失函数包括两个主要部分:自相关一致性损失(self-correlation consistency loss)和干扰相关一致性损失(disturbance correlation consistency loss)。这两部分共同作用于模型,以保持和传递源域中图像的内在空间结构及其变化趋势到目标域。

    2. 自相关一致性损失:用于约束图像的固有结构。通过这一部分,模型学习在源域和目标域生成的图像对之间保持相似的自相关特征,从而确保图像在结构上的一致性。

      自相关一致性损失(Self-correlation consistency loss)的计算在论文中的具体实现如下:

      1. 特征图的自相关矩阵:对于每个卷积层,使用该层的特征图 f l ∈ R c × w × h f_l \in \mathbb{R}^{c \times w \times h} flRc×w×h 来形成图像的内在结构信息。这里, f l ( x , y ) f_l(x, y) fl(x,y) 是一个 c c c 维向量,表示在 l l l 层中位置 ( x , y ) (x, y) (x,y) 的特征。

      2. 自相关矩阵的计算:对于位置 ( x , y ) (x, y) (x,y) l l l 层的自相关矩阵 C x y l ∈ R w × h C_{xy}^l \in \mathbb{R}^{w \times h} CxylRw×h,每个元素 C x y l ( i , j ) C_{xy}^l(i, j) Cxyl(i,j) 可以通过以下公式计算:
        C x y l ( i , j ) = cos ⁡ ( f l ( x , y ) , f l ( i , j ) ) C_{xy}^l(i, j) = \cos(f_l(x, y), f_l(i, j)) Cxyl(i,j)=cos(fl(x,y),fl(i,j))
        其中, cos ⁡ ( ⋅ ) \cos(\cdot) cos() 表示余弦相似度函数, ( i , j ) (i, j) (i,j) f l f_l fl 中的对应位置。

      3. 损失函数的计算:在源域生成器 G s G_s Gs 和目标域生成器 G t G_t Gt 之间计算空间自相关一致性损失:

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

懒惰才能让科技进步

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值