GAN 入门

最新推荐文章于 2025-09-30 16:03:18 发布

翻译最新推荐文章于 2025-09-30 16:03:18 发布 · 485 阅读

·

0

·

文章标签：

deep-learning 同时被 2 个专栏收录

1 篇文章

订阅专栏

1 篇文章

订阅专栏

本文介绍GAN（生成对抗网络）的基本原理，包括两个核心组件：生成器G和判别器D的作用及优化过程。通过随机噪声生成图片，并由判别器评估真伪，最终实现真假难辨的效果。

GAN入门
GAN的基本原理其实非常简单，这里以生成图片为例进行说明。假设我们有两个网络，G（Generator）和D（Discriminator）。正如它的名字所暗示的那样，它们的功能分别是：

D是一个判别网络，判别一张图片是不是“真实的”。它的输入参数是x，x代表一张图片，输出D（x）代表x为真实图片的概率，如果为1，就代表100%是真实的图片，而输出为0，就代表不可能是真实的图片。他的目标是D(x)=1 => max log(D(x))
G是一个生成图片的网络，它接收一个随机的噪声z，通过这个噪声生成图片，记做G(z)。它的目标是D(G(z))=1 ,=> min log(1-D(G(z))

而他们的优化公式是
优化公式1
他们的优化步骤是：

先对D进行k次优化，再对G进行优化。能避免过拟合，且保持D的最优。在实际工程中，为何避免早期的训练一直被拒绝，可以先优化 max D(G(z)),而非min log(1 − D(G(z)))

在训练后，D(G(z))=D(x)= $\frac{1}{2}$ .达到真假难分的效果.

其中，D 的最优公式应该是 $D_{G}(x)= \frac{p_{data}(x) }{p_{data}(x) +p_{g}(x) }$
令 $V(G,D) = \int_x{p_{data}(x)log({D(x))}}+p_y(x)log(1-D(x))dx$
而
这里写图片描述

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。