生成对抗网络GAN包含一个生成器(Generator)和一个判别器(Discriminator)。生成器用来生成假图片,判别器则用来区分,输入的图片是真图片还是假图片。生成器希望生成的图片可以骗过判别器(以假乱真),而判别器则希望提高辨别能力防止被骗。两者互相博弈,直到系统达到一个稳定状态(纳什平衡)。
1.训练
思想:D想来提升真图鉴别率,减少假图鉴别率。MAX V(D,G) =>MAX logD(X) +MAX log(1-D(Gz))=>结果是,MAX D(X) + Min D(Gz),符合D逻辑。
G想减少D对假图的鉴别率。MIN V(D,G) => MIN log(1-D(Gz)) => Min D(Gz),符合G逻辑。
2.纳什平衡:
1)G fixed,先训练D->D*:
,MAX之。
2)After D* ,然后训练G:
MIN,Djs>=0,当pr=pg时,Djs=0。
3.缺点
GAN训练不稳定,也就是用JS当度量标准训练时会的问题,因为当Pr,Pg分布不重合时,JS散度一直是log2,会出现梯度弥散问题,导致得不到更新,二分类的分类器达到100%的精度。可参考GAN:两者分布不重合JS散度为log2的数学证明。