生成对抗网络&sigmoid

最新推荐文章于 2025-06-09 22:03:20 发布

原创

最新推荐文章于 2025-06-09 22:03:20 发布 · 475 阅读

1 ·

CC 4.0 BY-SA版权

探讨在生成对抗网络(GAN)中使用Sigmoid激活函数导致的梯度消失问题，及其对训练过程的影响，特别是在生成器和辨别器能力不平衡时的表现。

GAN论文:https://arxiv.org/abs/1406.2661

sigmoid

sigmoid/tanh作为映射函数，很好的把输出限制到目标区间，但是随之带来的问题是反向传播的收敛问题——梯度消失。

$f (x) = s i g m o i d (x)$
$\nabla f(x) = sigmoid(x)[1-sigmoid(x)]$
$\nabla f(x) =f(x)[1-f(x)]$

GAN

以生成对抗网络为例。
在论文中，对算法的伪代码描述如下:
生成器与辨别器的训练过程
如果在 $G$ 和 $D$ 中使用sigmoid激活函数，那在训练的收敛会出现问题。
以辨别器 $D$ 为例:

辨别器 $D$ :

假设 $D$ 的最后一层激活函数为 $s i g m o i d$ 。未经过激活时的值为 $D_{uact}$ ，即

$D_{act}=sigmoid(D_{uact})$

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

mutou_cly

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

PyTorch生成式人工智能——生成对抗网络数值数据生成

盼小辉丶的博客

05-26

6575

在本节，首先学习如何将训练数据转换为神经网络能够理解的格式——独热编码 (one-hot encoding)。然后，将独热编码变量转换回 0 到 99 之间的整数，便于人类理解。换句话说，实际上是在将数据在可读格式与模型所需的格式之间进行转换。之后，将创建一个判别器和一个生成器，并训练生成对抗网络 (Generative Adversarial Network, GAN)，使用提前停止方法来判断训练何时结束。训练完成后，丢弃判别器，使用已训练好的生成器生成具有所需模式的整数序列。

PyTorch生成式人工智能——基于生成对抗网络生成服饰图像

盼小辉丶的博客

06-01

6652

我们已经学习了生成对抗网络 (Generative Adversarial Network, GAN) 的工作原理，接下来，将学习如何将其应用于生成其他形式的内容。在本节中，介绍使用 GAN 创建灰度图像，包括外套、衬衫、凉鞋等服饰，学习在设计生成器网络时如何镜像判别器网络。在本节中，生成器和判别器网络使用全连接层，全连接层的每个神经元都与前一层和后一层的所有神经元相连接。

参与评论您还未登录，请先登录后发表或查看评论

BERT模型原理的详细介绍

weixin_40444270的博客

11-15

9033

【NLP】Google BERT模型原理详解 - rumor的文章 - 知乎 1. BERT模型 BERT的全称是Bidirectional Encoder Representation from Transformers，即双向Transformer的Encoder，因为Decoder是不能获要预测的信息的。 BERT = Encoder of Transformer 模型的主要创新点都在pre-train方法上，即用了Masked LM和Next Sentence Prediction两种方法分别捕捉词

生成式对抗网络基础——神经网络初步（一）激活函数

小林同学的计算机学习

01-04

1089

几种激活函数的实现

生成对抗网络（GANs）中的损失函数公式 判别器最优解D^*(x)的推导

misuseds的博客

05-26

1153

这张图片展示的是生成对抗网络（GANs）中的损失函数公式，特别是针对判别器（Discriminator）和生成器（Generator）的优化目标。通过上述公式，我们了解了GAN中判别器和生成器之间的博弈过程，以及如何通过优化损失函数来训练这两个模型，以达到生成高质量样本的目的。这个公式展示了判别器的目标是最大化其对真实样本的识别能力和对生成样本的拒绝能力。：分别代表判别器正确识别真实样本和错误识别生成样本的对数概率。是标签（1表示真实样本，0表示生成样本），：判别器输出的真实样本的概率。

对抗生成网络（GAN）中的损失函数

L888666Q的博客

11-10

1万+

L1损失函数又称为MAE(mean abs error)，即平均绝对误差，也就是预测值和真实值之间差值的绝对值。 L2损失函数又称为MSE(mean square error)，即平均平方误差，也就是预测值和真实值之间差值的平方。

生成对抗网络的损失函数如何设计_一文详解生成对抗网络(GAN)的原理，通俗易懂...

weixin_39521808的博客

12-23

1887

‍‍前言GAN网络是近两年深度学习领域的新秀，火的不行，本文旨在浅显理解传统GAN，分享学习心得。现有GAN网络大多数代码实现使用Python、torch等语言，这里，后面用matlab搭建一个简单的GAN网络，便于理解GAN原理。GAN的鼻祖之作是2014年NIPS一篇文章：Generative Adversarial Net(https://arxiv.org/abs/1406.2661),可...

AIGC实战——生成对抗网络(Generative Adversarial Network, GAN)

盼小辉丶的博客

12-01

9184

生成对抗网络 (Generative Adversarial Network, GAN) 是由 Ian Goodfellow 等人在 2014 年提出的一种强大的深度学习模型，可以用于生成新数据样本，比如图像、音频、文本等。GAN 包含两个神经网络：生成器和判别器。生成器根据输入的噪声信号生成一些伪造的数据样本，而判别器则负责判断该数据样本是真实的还是伪造的。在本节中，首先阐述生成对抗网络的理论基础，然后使用 Keras 构建生成对抗网络模型。

DCGAN深度卷积生成对抗网络&python自动绘图

子非鱼的博客

01-16

4689

GAN 生成对抗网络 是一种深度学习模型，是近年来复杂分布上无监督学习最具前景的方法之一。模型通过框架中（至少）两个模块：生成模型（Generative Model）和判别模型（Discriminative Model）的互相博弈学习产生相当好的输出。什么是DCGAN DCGAN是GAN的一个变体。 Deep Convolutional GAN 深度卷积生成对抗网络。里面有生成器和判别器...

生成对抗网络（GAN）损失函数解读

最新发布

羽球小鼠的博客

06-09

1984

通过对抗性训练，生成器和判别器互相竞争，最终生成器能够生成越来越真实的样本。

生成对抗网络损失函数的理解

qikaihuting的博客

12-12

5万+

tf.nn.sigmoid_entropy_with_logits(labels,logits) 对抗网络中生成器的目的是尽可能使生成样本分布拟合真实样本分布。鉴别的目的是尽可能鉴别输入样本来自于真实的还是生成的。 ...

生成对抗网络的损失函数如何设计_生成对抗网络（GAN）

weixin_42517019的博客

12-23

2621

GAN的全称是 Generative Adversarial Networks，中文名称是生成对抗网络。原始的GAN是一种无监督学习方法，巧妙的利用“博弈”的思想来学习生成式模型。1 GAN的原理GAN的基本原理很简单，其由两个网络组成，一个是生成网络G(Generator) ，另外一个是判别网络D(Discriminator)。它们的功能分别是：生成网络G：负责生成图片，它接收一个随机的噪声 $...

生成对抗式网络GAN 的 loss

z1102252970的专栏

04-27

2万+

GAN同时要训练一个生成网络(Generator)和一个判别网络(Discriminator)，前者输入一个noise变量 zz ，输出一个伪图片数据 G(z;θg)G(z;\theta_g)，后者输入一个图片(real image)以及伪图片(fake image)数据 xx ，输出一个表示该输入是自然图片或者伪造图片的二分类置信度 D(x;θd)D(x;θ_d)，理想情况下，判别器DD 需要尽可

以假乱真的对抗生成网络（GAN）

Chile_Wang的博客

09-13

1149

本期课程到这里，博主就默认大家已经对BP、CNN、RNN等基本的神经网络属性以及训练过程都有相应的认知了，如果还未了解最基本的知识，可以翻看博主制作的深度学习的学习路线，...

在生成对抗网络（GAN）原始论文中损失函数的表示方法

m0_51200050的博客

07-03

1538

损失函数的表示和理解：通过期望值的公式表示损失函数，可以更清楚地理解 GAN 的训练目标和对抗机制。对抗训练的目标：判别器最大化损失函数，生成器最小化损失函数，通过这种对抗训练不断提升双方的性能。实际应用中的挑战：尽管理论上可以达到理想状态，但实际训练中存在许多挑战和不确定因素，需要不断改进生成器的性能。

GAN（Generative Adversarial Nets (生成对抗网络)）

qq_42728437的博客

05-15

4352

②部分，此时判别器D的输入为G(z)，为假图像，但是我们期望的是生成器的效果好，即尽可能的瞒过D，也就是期望D(G(z))尽可能大，越大表示D判定假图像为真实数据的概率越大，也就表明生成器G生成的图像效果好，可以成功的骗过D。在训练的时候，D(G(z))越大越接近于1，y越小，生成器生成的假图越被判别器误判为真图。但训练刚开始时，生成的图像太假，太容易被判别器识破，D(G(z))接近0，log(1-D(G(z)))饱和无梯度，所以将最小化log(1-D(G(z)))变为最大化log(D(G(z)))

DL | GAN: Generative Adversarial Nets 生成对抗网络算法学习

iLOVEJohnny的博客

06-15

896

题外话：本文是生成对抗网络GAN的基础理论学习的笔记，主要是基于Goodfellow于2014年发表的论文Generative Adversarial Nets。话说GAN已经火了这么多年，今天才提笔写笔记真是不好意思，然后刚才突然惊奇地发现，今天是GAN论文release在arXiv上正好整整五年。2014年6月10日，Ian Goodfellow向学术界发表了他同导师头脑风暴之下设计...

生成对抗网络——GAN（一）

生成对抗网络&sigmoid

sigmoid

GAN

辨别器 D D D:

辨别器 $D$ :