[CVPR 2019] Generalized Zero- and Few-Shot Learning via Aligned Variational Autoencoders

最新推荐文章于 2024-09-02 08:34:58 发布

原创最新推荐文章于 2024-09-02 08:34:58 发布 · 3.7k 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#VAE #ZSL #FSL #GZSL

零样本学习专栏收录该内容

20 篇文章

订阅专栏

本文介绍了一种名为对齐VAE的方法，该方法在广义少样本学习中表现突出，能够学习图像和语义共享的隐含空间，并为未见类生成隐含特征。通过跨域对齐和分布对齐，该模型优化了变分自编码器（VAE）的性能，特别是在处理少量样本时。

广义少样本学习之对齐VAE

本文亮点：学习图像和语义共享的隐含空间，为未见类生成隐含特征。

文章目录

- 广义少样本学习之对齐VAE
论文下载
VAE 变分自编码器
模型
- Cross and Distribution Aligned VAE
参考

论文下载

CVPR 2019

VAE 变分自编码器

变分自编码器是一种生成模型。它包含两部分，编码器和解码器。首先，编码器在样本 $x$ 上学习一个样本特定的正态分布；然后，从这个正态分布中随机采样一个变量；最后，解码器将这个变量作为输入，然后生成一个样本 $\hat x$ 。

模型

跨域对齐、分布对齐变分自编码器

Cross and Distribution Aligned VAE

basic M VAE losses VAE损失

$\mathcal{L}_{VAE} = \sum_i^M \mathbb{E}_{q_{\phi (z|x)}} [\log{p_0(x^{(i)}|z)}] \\ -\beta D_{KL}(q_{\phi}(z|x^{(i)})||p_{\theta}(z)) \tag{2}$

Cross-Alignment (CA) Loss 跨域对齐损失

$\mathcal{L}_{CA} = \sum_i^M \sum_{j \neq i}^M |x^{(j)} - D_j(E_i(x^{(i)}))| \tag{3}$

Distribution-Alignment (DA) Loss 分布对齐损失
分布i和分布j的2-Wasserstein 距离的闭形式解如下：

$W_{ij} = [||\mu_i - \mu_j||_2^2\\ + Tr(\sum_i) + Tr(\sum_j) - 2 (\sum_i^{\frac{1}{2}} \sum_i \sum_j^{\frac{1}{2}})^{\frac{1}{2}}]^{\frac{1}{2}} \tag{4}$

由于编码器预测对角协方差矩阵，这是交换的，这个距离可以简化：

$W_{ij} = (||\mu_i - \mu_j||_2^2 + ||\sum_i^{\frac{1}{2}} - \sum_j^{\frac{1}{2}}||_{Frobenius}^{2})^{\frac{1}{2}} \tag{5}$

所以，对于M个域DA损失如下：
$\mathcal{L}_{DA} = \sum_i^M \sum_{j \neq i}^M W_{ij} \tag{6}$

CADA-VAE loss

$\mathcal{L}_{CADA-VAE} = \mathcal{L}_{VAE} + \gamma \mathcal{L}_{CA} + \delta \mathcal{L}_{DA} \tag{7}$

参考

变分自编码器 - 蜉蝣之翼