附录B GAN学习可能性

最新推荐文章于 2025-08-05 08:41:01 发布

sunshinecxm_BJTU

最新推荐文章于 2025-08-05 08:41:01 发布

阅读量273

点赞数

CC 4.0 BY-SA版权

分类专栏：《PyTorch生成对抗网络编程》读书笔记文章标签：学习计算机视觉人工智能

本文链接：https://blog.youkuaiyun.com/qq_36744449/article/details/124561300

《PyTorch生成对抗网络编程》读书笔记专栏收录该内容

14 篇文章

订阅专栏

附录B GAN学习可能性

GAN到底能学到什么？这是一个很好的问题，但并没有一个显而易见的答案。

接下来，我们将以不使用过多数学术语的方式，对GAN所学习的内容进行直观的解释。让我们先从GAN不能学习什么开始吧。

B.1 GAN不会记忆训练数据

GAN不会学习记忆训练数据中的实例，包括任何实例中的具体部分。对于由人脸图像组成的训练数据，这意味着生成器不会记忆眼睛、耳朵、嘴唇或鼻子等元素。

另一方面，生成器不会直接看到训练数据。它所学习到的，只是来自鉴别器的反向传播误差反馈，而鉴别器本身只能做出图像真伪的二元判断。

其实，GAN学习的是训练数据中每个元素出现的可能性（likelihood）。

B.2 简单的例子

下图是一个非常小的、只有8幅图像的数据集。每幅图像也非常小，仅有3像素× 3像素。此外，像素只能是两个值中的一个，在这里表示为蓝色或白色。在这里插入图片描述
作为人类，如果我们被要求画出一幅图像，使它看起来属于这个数据集，我们可能会凭直觉把蓝色像素画在图像中心和左上角。我们也可能把蓝色像素画在左下角。

在这种直觉的背后，是对“一个像素有多大可能是蓝色”的理解。我们看到，大多数图像的中心像素是蓝色的。事实上，除了其中一幅图像之外，其他所有的图像都符合这一规律。许多图像的左上角也有一个蓝色像素。有几幅图像的左下角像素是蓝色。同时，有些位置，比如中上（中心像素上方）的像素，从来都不是蓝色的。

让我们看一下实际的计算过程。我们可以统计出每个像素点是蓝色的样本数。下面左图的矩阵中显示了这些统计。在8幅训练图像中，左上角的像素在6幅中都是蓝色的，而左下角是蓝色的只有2幅。中上的蓝色像素出现次数为0。因为中上的像素在任何一幅训练图像中都不是蓝色的。 在这里插入图片描述
这些统计数字可以被转换成可能性，也被称为概率。转换过程只需要将每个数字除以可能出现的最大次数，这里是8。这些概率显示在上图右边的矩阵中。