初始PyTorch(九):对抗生成网络GAN

本文深入解析生成对抗网络(GAN)的工作原理,包括生成器与判别器的博弈过程,达到纳什平衡的状态,以及在训练过程中遇到的稳定性问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

生成对抗网络GAN包含一个生成器Generator)和一个判别器Discriminator)。生成器用来生成假图片,判别器则用来区分,输入的图片是真图片还是假图片。生成器希望生成的图片可以骗过判别器(以假乱真),而判别器则希望提高辨别能力防止被骗。两者互相博弈,直到系统达到一个稳定状态(纳什平衡)。

1.训练

思想:D想来提升真图鉴别率,减少假图鉴别率。MAX V(D,G) =>MAX logD(X) +MAX log(1-D(Gz))=>结果是,MAX D(X) + Min D(Gz),符合D逻辑。
           G想减少D对假图的鉴别率。MIN V(D,G) => MIN log(1-D(Gz)) => Min D(Gz),符合G逻辑。

2.纳什平衡:

1)G fixed,先训练D->D*:

,MAX之。

2)After D* ,然后训练G:

MIN,Djs>=0,当pr=pg时,Djs=0。

3.缺点

GAN训练不稳定,也就是用JS当度量标准训练时会的问题,因为当Pr,Pg分布不重合时,JS散度一直是log2,会出现梯度弥散问题,导致得不到更新,二分类的分类器达到100%的精度。可参考GAN:两者分布不重合JS散度为log2的数学证明

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

nooobme

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值