生成对抗网络(GAN)
那什均衡
Nash equilibrium ,又称为非合作博弈均衡。所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。
对应的,对于GAN来说,生成模型恢复了训练数据的分布(无法分辨生成数据与真实数据),判别模型无法得出正确的判别效果,准确率为50%。这时双方网络都得到利益最大化,不改变自身策略,即不再更新自身的权重。
GAN模型
m i n G m a x D V ( D , G ) = E x ∼ P d a t a ( x ) ] [ l o g D ( x ) ] + E z ∼ p z ( z ) [ l o g ( 1 − D ( G ( z ) ) ) ] \mathop{min}\limits_{G}\ \mathop{max}\limits_{D}V(D,G)=E_{x\sim P_{data}(x)}][log D(x)]+E_{z\sim p_{z}(z)}[log(1-D(G(z)))]