人工智能顶会CVPR2022《Few Shot Generative Model Adaption via Relaxed Spatial Structural Alignment》论文解读

最新推荐文章于 2024-07-11 14:58:21 发布

原创

最新推荐文章于 2024-07-11 14:58:21 发布 · 1.5k 阅读

18 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #深度学习 #神经网络 #python

Few Shot Generative Model Adaption via Relaxed Spatial Structural Alignment

1.引言
- 面临的挑战
2.Relaxed Spatial Structural Alignment (RSSA)
3.总结

1.引言

在小样本学习领域，生成模型适应性的研究对于提升模型在有限数据条件下的学习能力至关重要。传统的生成模型通常需要大量数据来训练，而在实际应用中，尤其是在特定的或者罕见的场景中，获取大量标注数据通常是不切实际的。小样本学习旨在解决这一问题，通过开发能够从少量样本中快速适应和学习的模型，来推广模型的应用范围，提高其在特定任务上的性能。有效的生成模型适应性不仅可以增强模型对新任务的快速适应能力，还能在数据稀缺的领域中发挥关键作用，如医学图像分析、生物信息学和其他需要定制化模型的应用。

面临的挑战

使用少样本的生成模型在适应性方面面临的主要挑战包括：

模型过拟合与崩溃：在极少样本的情况下（少于10个），常规的生成模型通常会产生质量较差的图像，并且容易发生早期崩溃。
身份退化和非自然失真：即使是通过对比学习提出的保持源域实例间相对距离的方法，也无法保证每个图像的固有结构，导致样本在目标域空间中漂移，最终造成身份退化和非自然的失真或纹理变化。
现有方法的局限性：尽管一些方法通过微调策略直接建模目标域的分布，或通过施加强正则化、轻微扰动网络参数、数据增强等方法来避免过拟合，但这些方法通常只适用于训练图像数量超过100的情况。

针对这些挑战，论文提出了一种新的适应性方法，即放松的空间结构对齐（RSSA），该方法利用源域图像更丰富的空间结构先验来解决生成模型的身份退化问题。

2.Relaxed Spatial Structural Alignment (RSSA)

在这里插入图片描述

Relaxed Spatial Structural Alignment (RSSA) 的详细工作原理包括以下几个关键部分：

生成模型的预训练与适应：在RSSA中，首先有一个在大规模源域数据集 $D_s$ 上预训练的生成器 $G_s$ 。这个生成器将从潜在空间 $\sim p(z) \subset \mathbb{R}^d$ 中采样的噪声向量 $z$ 映射到像素空间中的生成图像 $G_s(z)$ 。少样本适应的目标是将 $G_s$ 从源域适应到目标域，并使用目标域中的少量样本获取目标生成器 $G_t$ 。通常，这是通过用 $G_s$ 初始化 $G_t$ 并在目标域数据集 $D_t$ 上微调 $G_t$ 来完成的。
跨域空间结构一致性损失： $L_{Gs \leftrightarrow Gt}$ 是RSSA方法的核心，由自相关一致性损失和干扰相关一致性损失组成。这一损失函数帮助保持源域和目标域生成的图像对之间的结构一致性，通过保持图像的内在空间结构和变化趋势来解决身份退化和图像失真问题。
1. 什么是跨域空间结构一致性损失？
  
  跨域空间结构一致性损失（Cross-domain spatial structural consistency loss）是为了解决少样本生成模型适应问题而提出的一种创新损失函数。这一损失函数包括两个主要部分：自相关一致性损失（self-correlation consistency loss）和干扰相关一致性损失（disturbance correlation consistency loss）。这两部分共同作用于模型，以保持和传递源域中图像的内在空间结构及其变化趋势到目标域。
2. 自相关一致性损失：用于约束图像的固有结构。通过这一部分，模型学习在源域和目标域生成的图像对之间保持相似的自相关特征，从而确保图像在结构上的一致性。
  
  自相关一致性损失（Self-correlation consistency loss）的计算在论文中的具体实现如下：
  1. 特征图的自相关矩阵：对于每个卷积层，使用该层的特征图 $f_l \in \mathbb{R}^{c \times w \times h}$ 来形成图像的内在结构信息。这里， $f_l(x, y)$ 是一个 $c$ 维向量，表示在 $l$ 层中位置 $(x, y)$ 的特征。
  2. 自相关矩阵的计算：对于位置 $(x, y)$ 在 $l$ 层的自相关矩阵 $C_{xy}^l \in \mathbb{R}^{w \times h}$ ，每个元素 $C_{xy}^l(i, j)$ 可以通过以下公式计算：
    $C_{xy}^l(i, j) = \cos(f_l(x, y), f_l(i, j))$
    其中， $\cos(\cdot)$ 表示余弦相似度函数， $(i, j)$ 是 $f_l$ 中的对应位置。
  3. 损失函数的计算：在源域生成器 $G_s$ 和目标域生成器 $G_t$ 之间计算空间自相关一致性损失：

最低0.47元/天解锁文章