一.生成对抗网络简介
1.生成对抗网络模型主要包括两部分:生成模型和判别模型。 生成模型是指我们可以根据任务、通过模型训练由输入的数据生成文字、图像、视频等数据。
[1]比如RNN部分讲的用于生成奥巴马演讲稿的RNN模型,通过输入开头词就能生成下来。
[2]或者由有马赛克的图像通过模型变成清晰的图像,第一张是真实,第四张是合成的。
[3]或者我们为了生成一类图像时会通过输入指定的分布形态数据,这样经过训练数据和输入分布形态后,就可以将分布形态输入网络获得这一类的图像(可用于数据集的扩展,图片的合成,思路等下介绍),左图是看了大量街景记录生成的未见过的场景。
二生成对抗网络 —— 基本机构
1.生成模型从本质上是一种极大似然估计,用于产生指定分布数据的模型,生成模型的作用是捕捉样本数据的分布、将原输入信息的分布情况经过极大似然估计中参数的转化来将训练偏向转换为指定分布的样本。
2.判别模型实际上是个二分类,会对生成模型生成的图像等数据进行判断,判断其是否是真实的训练数据中的数据。
二生成对抗网络 —— 模型介绍
1.对于GAN,一个简单的理解是可以将其看做博弈的过程,我们可以将生成模型和判别模型看作博弈的双方,比如在犯罪分子造假币和警察识别假币的过程中:
[1]生成模型G相当于制造假币的一方,其目的是根据看到的钱币情况和警察的识别技术,去尽量生成更加真实的、警察识别不出的假币。
[2]判别模型D相当于识别假币的一方,其目的是尽可能的识别出犯罪分子制造的假币。 这样通过造假者和识假者双方的较量和朝目的的改进,使得最后能达到生成模型能尽可能真的钱币、识假者判断不出真假的纳什均衡效果(真假币概率都为0.5)。
2.我们可以将上面的场景映射成图片之间生成模型和判别模型之间的博弈过程,博弈的简单模式如