深度学习基于WGAN解决GAN网络训练时的梯度消失和梯度爆炸问题

最新推荐文章于 2025-10-10 06:32:02 发布

小鹏AI

最新推荐文章于 2025-10-10 06:32:02 发布

阅读量3.5k

点赞数

CC 4.0 BY-SA版权

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.youkuaiyun.com/qq_38973721/article/details/107771720

Latest Tech 专栏收录该内容

84 篇文章 ¥299.90 ¥399.90

订阅专栏

超级会员免费看

本文介绍了如何利用Wasserstein GAN（WGAN）解决生成对抗网络（GAN）在训练过程中遇到的梯度消失和梯度爆炸问题。通过调整损失函数以确保梯度为1，从而避免梯度消失，并通过限制判别器参数的范围来防止梯度爆炸，以达到更好的训练效果和图像生成质量。

GAN网络结构

首先将样本图片传入到判别器中进行处理，不断的优化判别器，使所得到的概率为1

其次，将随机语义值传入到生成器中得到一个假的图片样本数据，将假的样本数据输入到判别器中进行处理，不断的优化判别器，使所得到的的概率为0（这个部分主要是训练判别器）

最后，重复上诉步骤，不断的优化生成器，从而达到对抗的效果

当生成器和判别器的优化达到动态的平衡（也就是纳什均衡）所得到的图片就是我们想要图片的最好的效果

过程虽然简单，但是会出现梯度消失的问题，原因如下：

在步骤一种，我们将样本X 传辨别器入到判别器D中会得到逻辑值Logits

其次我们将逻辑值进行Sigmoid函数进行激活操作得到概率值P

最后我们将生产的概率值进行交叉熵的操作最终可以得到我们想要的损失值Loss

当我们在反向传播的时候，会出现以下的问题：（公式推导）

$p$

了解本专栏

订阅专栏解锁全文

超级会员免费看

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小鹏AI

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
3
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

订阅专栏

如何解决梯度消失和梯度爆炸？

优快云精品推荐

08-08

463

在反向传播过程中，梯度逐层传递并乘以权重，如果梯度在每一层都接近于零，那么在反向传播时梯度会逐渐变小，最终导致较深层的权重更新几乎没有变化，即梯度消失。在反向传播过程中，梯度同样逐层传递并乘以权重，如果权重较大，梯度在每一层都会增大，导致在反向传播时梯度急剧增加，从而权重更新变得异常巨大，即梯度爆炸。梯度爆炸问题通常出现在具有较深层次的神经网络中，特别是在网络的层数较多时，由于梯度在反向传播过程中要乘以每一层的权重，如果这些权重较大，梯度就会不断增大，可能会引发梯度爆炸问题。

揭秘：Wasserstein GAN与梯度惩罚（WGAN-GP）

gongdiwudu的专栏

09-13

7817

什么是梯度惩罚？为什么它比渐变裁剪更好？如何实施梯度惩罚？在提起GAN对抗网络中，就不能避免Wasserstein距离的概念，本篇为系列读物，目的是揭示围绕Wasserstein-GAN建模的一些重要概念进行探讨。

3 条评论您还未登录，请先登录后发表或查看评论

对抗网络GAN详解：GAN训练不稳定解决方法、GAN中使用的深度学习技巧、GAN使用任务领域、GAN资料大全整理

丨汀、的博客

07-18

8512

对抗网络GAN详解：GAN训练不稳定解决方法、GAN中使用的深度学习技巧、GAN使用任务领域、GAN资料大全整理

GAN知识点（一）：GAN的网络结构与损失

ARYAD的博客

08-21

2244

该知识点中，我们首先介绍生成对抗网络GAN的主要模型架构——生成器和鉴别器。其次，我们介绍GAN的损失函数以及相关的训练过程。

彻底解决PyTorch-GAN训练崩溃：3大梯度问题修复方案

最新发布

gitblog_01056的博客

10-10

240

你是否在训练生成对抗网络（GAN）时遇到过模型发散、梯度爆炸或梯度消失问题？本文将通过PyTorch-GAN项目中的真实案例，详解三种梯度稳定技术的实现方式，帮助你在MNIST、图像翻译等任务中获得稳定训练结果。读完本文你将掌握：WGAN-GP梯度惩罚、DRAGAN边界约束、Batch Normalization参数调优的具体操作方法。 ## 梯度问题的表现与影响在GAN训练中，梯度异常通常...

GAN模型存在的问题分析（梯度消失、模式崩溃）

coderge's 优快云 Blog.

06-04

1万+

原始的GAN并不成熟，存在着诸多问题，其中梯度消失和模式崩溃（collapse mode）问题严重限制GAN的发展。只有了解问题发生的本质，才能做出相应的改进，本章主要对GAN在训练中存在梯度消失和模式崩溃的原因进行分析。梯度消失即是利用误差反向传播（back propagation,BP）算法对深度神经网络进行训练时，梯度后向传播到浅层网络时基本不能引起数值的扰动，最终导致神经网络收敛很慢甚至不能收敛。GAN存在梯度消失的问题，并且在判别器训练得越好的时候，生成器梯度消失得越严重。最优判别器如下式: DG

生成对抗网络原理公式与代码

ncf的博客

10-18

2393

1. 生成对抗网络的概念与公式1 我们没次看生成对抗的公式，都会出现一个疑问，每次看懂之后，过一段时间遇到，还是得看半天，md，这一次记录下来！ 1.1 判别网络有疑惑的是： 13.30式，作者说判别网络的目标函数是最小化交叉熵。我对于交叉熵的第一印象来源于相对熵，相对熵越小，两个分布的差异越小，交叉熵与相对熵差一个常数，所以交叉熵越小，两个分布的差异越小。所以这里作者说判别网络的目标函数是最小化交叉熵，我第一反应是让生成的和真实的差异越小。我擦，判别网络的目的不是让生成和真实的差异越大吗？上述理

梯度消失，梯度爆炸

iron的博客

07-05

432

用Ik代表第K个神经元的总输入，用Ok代表第k个神经元的输出。举例计算5号神经元的梯度： Gk有可能在传播过程中绝对值越来越小（直到变成0），这称为梯度消失，其会使得网络的训练停滞不前。 Gk有可能在传播过程中绝对值越来越大（直到发散），这称为梯度爆炸，其会使得网络不稳定，性能崩溃。 梯度消失举例：如果采用sigmoid或tanh非线性，在输入的绝对值很大的时候，会出现“饱和”，即导数趋近0...

梯度消失的处理

weixin_38241876的博客

04-25

431

梯度消失的处理 梯度消失的原因：激活函数的饱和数据中噪声引起模型无法收敛梯度连乘导致学习率过大

详解深度学习中的梯度消失、爆炸原因及其解决方法

dreamer_18的博客

09-07

1161

参考链接：https://blog.youkuaiyun.com/qq_25737169/article/details/78847691 参考资料: 1.《Neural networks and deep learning》 2.《机器学习》周志华 3. https://www.cnblogs.com/willnote/p/6912798.htm 4. https://www.zhihu....

latex梯度_不用L约束又不会梯度消失的GAN，了解一下？

weixin_33480380的博客

01-17

283

不知道从什么时候开始，我发现我也掉到了GAN的大坑里边了，唉，争取早日能跳出来...这篇博客介绍的是我最近提交到arxiv的一个关于GAN的新框架，里边主要介绍了一种对概率散度的新理解，并且基于这种理解推导出了一个新的GAN。整篇文章比较偏理论，对这个GAN的相关性质都做了完整的论证，自认为是一个理论完备的结果。先摆结论：1、论文提供了一种分析和构造概率散度的直接思路，从而简化了构建新GAN框架的...

不用L约束又不会梯度消失的GAN，了解一下？

Paper weekly

11-21

911

作者丨苏剑林单位丨广州火焰信息科技有限公司研究方向丨NLP，神经网络个人主页丨kexue.fm不知道从什么时候开始，我发现我也掉到了 GAN 的大坑里边了，唉，争取早日能...

一文彻底搞懂深度学习：梯度消失和梯度爆炸

热门推荐

Code1994的博客

11-13

2万+

AI大模型作为人工智能领域的重要技术突破，正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口，掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程，需要从基础开始，逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源，包括：AI大模型全套学习路线图（从入门到实战）、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等，资料免费分享！

梯度消失与梯度膨胀，以及6种解决措施

MrLQD

04-08

2549

1.梯度消失根据链式法则，如果每一层神经元对上一层的输出的偏导乘上权重结果都小于1的话，那么即使这个结果是0.99，在经过足够多层传播之后，误差对输入层的偏导会趋于0。这种情况会导致靠近输入层的隐含层神经元调整极小。 2.梯度膨胀根据链式法则，如果每一层神经元对上一层的输出的偏导乘上权重结果都大于1的话，在经过足够多层传播之后，误差对输入层的偏导会趋于无穷大。这种情况又会导致靠近...

梯度消失，梯度爆炸及表现

暗时间

09-15

5416

梯度消失出现的原因经常是因为网络层次过深，以及激活函数选择不当，比如sigmoid函数。梯度爆炸出现的原因也是网络层次过深，或者权值初始化值太大。综合来看，这两种梯度问题产生的原因可以归结为网络深度，以及反向传播带来的遗留问题。反向传播基于的是链式求导法则。如果导数小于1，那么随着层数的增多，梯度的更新量会以指数形式衰减，结果就是越靠近输出层的网络层参数更新比较正常，而靠近输入层的网络层参...

葫芦书笔记----生成模型

沃·夏澈德的博客

10-29

358

图去书里看。生成模型生成模型就是要让机器找到产生数据的概率分布P(x)P(x)P(x). 变分自编码器基础知识 ###简述VAE的基本思想，以及它时如何用变分推断方法进行训练的？详细：自编码器（AE）：标准的AE由编码器和解码器两部分组成，整个模型可以看作一个“压缩”与“解压”的过程。（关于AE的详细介绍后面会有）图变分自编码器（VAE）假设数据xix_ixi由一个随机过程产生，该随机过程分为两步：先由先验分布Pθ∗(z)P_{\theta^*}(z)Pθ∗(z)产生隐藏变量ziz_izi

GAN的奇妙之谜：理解梯度崩溃问题

AI天才研究院

01-07

699

1.背景介绍 GAN(Generative Adversarial Networks，生成对抗网络)是一种深度学习算法，它通过将生成模型和判别模型看作是两个对抗的玩家，来学习数据分布并生成新的数据。GAN的核心思想是将深度学习问题转化为一个对抗游戏，让生成模型和判别模型相互竞争，从而提高模型的性能。然而，GAN在实际应用中遇到了许多挑战，其中最为著名的就是梯度崩溃问题。梯度崩溃问题是指在训练...

GAN训练过程调参记录

u013598963的博客

08-24

5509

前言笔者基于论文GLEAN: Generative Latent Bank for Large-Factor Image Super-Resolution(CVPR2021 oral)中的基于mmedit的开源代码（由mmlab实验室开发，集成化程度相当高）在自己的数据集上进行调试。作为深度学习萌新一枚，对GAN的使用毫无经验，因此写下这篇博客总结调试多天的心得收获，也或许能帮助到其他小伙伴。本文主要聚焦训练过程中参数调节等技巧层面的问题，并不涉及对StyleGAN中结构的分析亦或是对上述改进论

生成对抗网络（GAN）理论概念、改进模型与练习题

hanmo22357的博客

04-12

4797

使得生成器生成的假样本难以被不断优化的判别器识别出来。

深度学习 基于WGAN解决GAN网络训练时的梯度消失和梯度爆炸问题

深度学习基于WGAN解决GAN网络训练时的梯度消失和梯度爆炸问题