生成对抗网络与强化学习:原理、应用与实践
1. 利用EM距离训练GAN模型
在GAN模型训练中,可使用EM距离来衡量真实样本分布 (P_r) 和生成样本分布 (P_g) 之间的差异。不过,直接计算EM距离是一个优化问题,计算复杂度高,尤其是在GAN训练的每次迭代中重复计算时。幸运的是,可利用Kantorovich - Rubinstein对偶定理简化计算,公式如下:
[W(P_r, P_g) = \sup_{|f| L \leq 1} E {u \in P_r}[f(u)] - E_{v \in P_g}[f(v)]]
这里的上确界是对所有1 - Lipschitz连续函数 (f) (即 (|f|_L \leq 1) )取的。
2. 实际应用中的WGAN
要计算GAN中真实输出分布 (P_r) 和虚假输出分布 (P_g) 之间的Wasserstein距离,可训练一个神经网络模型来近似该距离函数。简单GAN使用分类器作为判别器,而WGAN将判别器改为评判器,返回一个标量分数,用于评估输入图像的真实程度。
3. Lipschitz连续性
1 - Lipschitz连续函数 (f) 需满足 (|f(x_1) - f(x_2)| \leq |x_1 - x_2|) 。更一般地,满足 (|f(x_1) - f(x_2)| \leq K|x_1 - x_2|) 的实函数 (f: R \to R) 被称为K - Lipschitz连续函数。
4. WGAN的损失函数
使用Wasserstein距离训练GAN时,判别器 (D) 和生成器 (G) 的损失函数定义如下
WGAN-GP与强化学习应用解析
超级会员免费看
订阅专栏 解锁全文
51

被折叠的 条评论
为什么被折叠?



