图像生成之生成对抗网络(Generative adversarial networks,GAN)

简要介绍

原文:Generative Adversarial Networks (arxiv.org)

​ 以前的一些模型是通过显示训练数据的分布,比如上面的VAE。也就是可以得到最终训练好的均值与方差,而GAN是隐式训练。

​ GAN受博弈论中的零和博弈启发,将生成问题视作判别器和生成器这两个网络的对抗和博弈:生成器从给定噪声中(一般是指均匀分布或者正态分布)产生合成数据,判别器分辨生成器的的输出和真实数据。前者试图产生更接近真实的数据,后者试图更完美地分辨真实数据与生成数据。由此,两个网络在对抗中进步,在进步后继续对抗,由生成网络得到的数据也就越来越完美,逼近真实数据,从而可以生成想要得到的数据(图片、序列、视频等)。

训练原理与公式推导

 GAN模型体系结构图示

图1 GAN模型体系结构图示

​ 设真实训练数据的分布服从 x ∼ p data x \sim p_\text{data} xpdata,先验噪声输入变量分布服从 z ∼ q z ( z ) z \sim q_z(z) zqz(z), 生成模型为 G ( z ; θ g ) G(z;\theta_g) G(z;θg),其中 θ g \theta_g θg是生成模型中的网络参数。设判别模型为 D ( z ; θ d ) D(z;\theta_d) D(z;θd),其中 θ d \theta_d θd是判别模型中的网络参数,生成模型通过学习数据 x x x得到生成模型分布 p g p_g pg。根据理论分析结果,如果给予生成模型足够的承载力和足够的训练时间,生成模型 G G G完全有可能拟合出类似于真实样本分布 p data p_\text{data} pdata的从假设随机分布 p z p_z pz得到的合成样本分布 p g p_g pg。 同时,当模型训练达到全局最优平衡点 p g = p data p_g=p_\text{data} pg=pdata的时候,说明生成对抗网络达到了 博弈的最佳状态。数学优化模型如下所示:
min ⁡   G max ⁡   D V ( D , G ) = E x ∼ p data ( x ) [ log ⁡ ( D ( x ) ) ] + E z ∼ p z ( z ) [ log ⁡ ( 1 − D ( G ( x ) ) ] \min_{\ G} \max_{\ D} V(D, G) = {E}_{x\sim p_{\text{data}}(x)}[\log(D(x))] +{E}_{z\sim p_z(z)}[\log(1 - D(G(x))]  Gmin DmaxV(D,G)=Expdata(x)[log(D(x))]+Ezpz(z)[log(1D(G(x))]

  • 生成器的目标函数为:

min ⁡   G E z ∼ p z ( z ) [ log ⁡ ( 1 − D ( G ( x ) ) ] \min_{\ G}E_{z\sim p_z(z)}[\log(1 - D(G(x))]  GminEzpz(z

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值