[解读] Multi-objective training of Generative Adversarial Networks with multiple discriminators

最新推荐文章于 2023-11-14 20:12:39 发布

天在那边

最新推荐文章于 2023-11-14 20:12:39 发布

阅读量810

点赞数 1

分类专栏：机器学习深度学习

本文链接：https://blog.youkuaiyun.com/weipf8/article/details/106277396

版权

机器学习同时被 2 个专栏收录

24 篇文章

订阅专栏

深度学习

24 篇文章

订阅专栏

本文介绍了一种使用多个鉴别器的生成对抗网络(GAN)训练方法，通过超体积最大化实现生成样本质量与训练效率的平衡。该方法在多目标优化框架下，解决了GAN训练的不稳定性问题，相较于现有技术，在计算成本和生成质量间提供了更优折衷。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文研究了多目标优化问题, 即通过使用多个鉴别器来提升生成样本的质量, 提出一种超体积最大化方法来进行训练, 这个优化方法在训练速度和生成样本质量之间达到了较好的权衡.

论文链接: https://arxiv.org/abs/1901.08680v1

本文内容

首先定义 $K$ 个鉴别器 $D_k$ , 每一个鉴别器和标准的 GAN 并无不同, 这些鉴别器的损失函数表达为:
$\mathcal{L}_{D_{k}}=-\mathbb{E}_{\mathbf{x} \sim p_{\text {datata }}} \log \left(D_{k}(\mathbf{x})\right)-\mathbb{E}_{\mathbf{z} \sim p_{z}} \log \left(1-D_{k}(G(\mathbf{z}))\right)$
对于生成器来说, 训练过程就是一个多目标优化问题, 首先定义优化目标:
$\min \mathcal{L}_{G}(\mathbf{z})=\left[l_{1}(\mathbf{z}), l_{2}(\mathbf{z}), \ldots, l_{K}(\mathbf{z})\right]^{T},$

其中 $l_{k}=-\mathbb{E}_{z \sim p_{z}} \log D_{k}(G(z)), k \in\{1, \ldots, K\}$ . 通过优化生成器达到帕累托最优解.

解这个问题有很多方法, 例如多梯度下降法, 平均损失法, 加权损失法等等, 本文提出超体积最大化方法. Fleischer (2003) 的研究表明超体积最大化能够产生帕累托最优解.

于是生成器的损失函数为
$\mathcal{L}_{G}=-\mathcal{V}=-\sum_{k=1}^{K} \log \left(\eta-l_{k}\right).$
对权重的梯度为
$\frac{\partial \mathcal{L}_{G}}{\partial \theta}=\sum_{k=1}^{K} \frac{1}{\eta-l_{k}} \frac{\partial l_{k}}{\partial \theta}.$

参数 $\eta$ 采用自适应的方法来确定, 对第 $t$ 次迭代有
$\eta^{t}=\delta \max _{k}\left\{l_{k}^{t}\right\}.$

参考

Berthelot, D., Schumm, T., and Metz, L. BEGAN: Boundary equilibrium enerative dversarial networks. arXiv preprint arXiv:1703.10717, 2017.
Heusel, M., Ramsauer, H., Unterthiner, T., Nessler, B., and Hochreiter, S. GANs trained by a two time-scale update rule converge to a local nash equilibrium. In dvances in Neural Information Processing Systems, pp. 6629–6640, 2017.
Lin, Z., Khetan, A., Fanti, G., and Oh, S. PacGAN: The power of two samples in generative adversarial networks. arXiv preprint arXiv:1712.04086, 2017.
Miyato, T., Kataoka, T., Koyama, M., and Yoshida, Y. Spectral normalization for generative adversarial networks. arXiv preprint arXiv:1802.05957, 2018.
Neyshabur, B., Bhojanapalli, S., and Chakrabarti, A. Stabilizing GAN training with multiple random projections. arXiv preprint arXiv:1705.07831, 2017.
Fleischer, M. The measure of pareto optima applications to multi-objective metaheuristics. In International Conference on Evolutionary Multi-Criterion Optimization, pp. 519–533. Springer, 2003.