[解读] The relativistic discriminator: a key element missing from standard GAN

本文提出了一种新的GAN(生成对抗网络)变体——相对GAN,旨在解决传统GAN中存在的问题,如梯度消失和模型崩溃。通过引入相对鉴别器,该方法不仅提高了生成样本的真实性,还降低了真实样本的预测概率,从而实现了更均衡的训练过程。实验结果显示,相对GAN在多个基准数据集上表现出更好的稳定性和生成质量。

在标准的 GAN 中, 鉴别器用来估计输入样本为真实样本的概率, 生成器用来生成逼真的样本, 来提高被鉴别器鉴别为真实样本的概率. 然而本文提出生成器应该同时降低真实样本的真实性的概率.

首先因为这符合一个先验知识, 即在一个批次中有一半数据是真实的, 并且可以用散度最小化来验证这个设想, 在最佳设置中, 标准的 GAN 等效于积分概率度量 (IPM) 的 GAN.

作者表明相对鉴别器 (relativistic discriminator) 能够产生这样的效果, 即用来估计真实样本比虚假样本更真实的概率.

论文链接: https://arxiv.org/abs/1807.00734v3

相关工作

标准的 GAN 有许多问题, 例如梯度消失, 梯度爆炸, 模型崩溃等等, 改进的方向也是开放的并且变体很多, 例如 LSGAN, WGAN, f-GAN 等等. 在最近有许多变体是基于概率积分度量的 (Integral Probability Metrics, IPSs)[Müller, 1997].

本文改进

设鉴别器为 D ( x ) D(x) D(x), 本文的核心观点是, 当虚假样本 x f x_f xf 的预测概率值 D ( x f ) D(x_f) D(xf) 升高的时候 (即生成器生成的样本变得愈加逼真), 真实样本 x r x_r xr 的预测概率值 D ( x r ) D(x_r) D(xr) 应该降低.

作者在文中给出了三种论证方法. 首先从先验知识的角度来说, 在每一轮迭代中, 从期望的角度考虑, 鉴别器需要鉴别的样本有一半的样本是真实的, 另一半是生成的, 这就意味着随着训练的进行, 对于一个样本的真实性鉴别概率应当等于 0.5. 然而在标准的 GAN 和其它非 IPM 的模型没有利用这一先验知识, 否则的话鉴别器有可能将所有训练样本视为真实的, 即概率值等于 1.

第二种论证角度从散度最小化出发. 从 GAN [Goodfellow et al., 2014] 中我们知道, 训练GAN的过程等价于最小化以下 JS 散度:
J S D ( P ∥ Q ) = 1 2 ( log ⁡ ( 4 ) + max ⁡ D : X → [ 0 , 1 ] E x r ∼ P [ log ⁡ ( D ( x r ) ) ] + E x f ∼ Q [ log ⁡ ( 1 − D ( x f ) ) ] ) . J S D(\mathbb{P} \| \mathbb{Q})=\frac{1}{2}\left(\log (4)+\max _{D: X \rightarrow[0,1]} \mathbb{E}_{x_{r} \sim \mathbb{P}}\left[\log \left(D\left(x_{r}\right)\right)\right]+\mathbb{E}_{x_{f} \sim \mathbb{Q}}\left[\log \left(1-D\left(x_{f}\right)\right)\right]\right). JSD(PQ)=21(log(4)+D:X[0,1]maxExrP[log(D(xr))]+ExfQ[log(1D(xf))]).
生成器的训练过程即是最小化散度的过程, 当 D ( x r ) = D ( x f ) = 1 2 D\left(x_{r}\right)=D\left(x_{f}\right)=\frac{1}{2} D(xr

### 关于相对论GAN (Relativistic GAN) #### 定义与背景 相对论GAN是一种改进型的生成对抗网络(GAN),其核心理念在于改变判别器(Discriminator)的工作模式。传统GAN中的判别器仅评估单个样本的真实性,而相对论GAN让判别器比较真实样本和生成样本之间的关系,从而更有效地训练生成器(Generator)[^1]。 #### 研究论文概述 在研究方面,《The relativistic discriminator: a key to improved fake detection for generative adversarial networks》这篇论文提出了相对论平均GAN(Relativistic average GAN, RaGAN),该模型不仅考虑了真假样本间的差异还引入了统计均值的概念来增强区分能力[^4]。这种设计使得RaGAN能够更好地捕捉分布特性,并显著提高了图像合成的质量以及稳定性。 #### 实现方法详解 为了实现上述理论上的优势,在具体实践中: - **损失函数调整**:对于每一个给定的真实数据$x$及其对应的伪造版本$\hat{x}$,定义新的损失项$L_{D}^{R}(x,\hat{x})=\left[D(x)-\frac{1}{m}\sum _{{i=1}}^{m}D(\hat {x}_{i})\right]$ 和 $L_{{G}}^{R}=E[L_D^R(g(z),g(z'))]$ ,这里$m$表示批次大小,$z,z'$是从相同噪声分布采样的两个独立变量。 这样做的目的是为了让判别器学会预测某个特定样本相对于其他同类样本而言更加逼真还是虚假的概率得分。 ```python import torch.nn as nn class RelativisticDiscriminator(nn.Module): def __init__(self): super().__init__() self.main = ... # Define your network architecture here def forward(self, real_images, generated_images): pred_real = self.main(real_images).mean() pred_fake = self.main(generated_images).mean() return pred_real - pred_fake ``` #### 应用案例分析 实际应用场景中,相对论GAN已被证明特别适用于高分辨率图像生成任务。例如,在人脸编辑领域,通过使用相对论标准下的对抗损失可以有效减少模式崩溃现象(mode collapse),即生成器不再局限于重复生产有限几种类型的输出而是能创造出更多元化的结果[^3]。此外,它也被用于风格迁移、超分辨率重建等多个计算机视觉子域内取得了不错的效果。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值