李沐GAN论文逐段精读(自学笔记)

本文介绍了生成对抗网络(GAN)中生成模型(G)和判别模型(D)的工作原理,用MLP模拟图像生成,通过优化目标函数让D难以区分真实数据和生成数据。文章详细描述了模型如何通过噪声变量和多维分布工作,以及如何通过KL散度和JS散度评估分布差异。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

G用来抓取整个数据的分布,因为生成模型就是要对整个数据的分布进行建模,使得我能生成各种分布。辨别模型D判别数据是生成出来的还是真实的,生成模型需要尽可能的使判别模型犯错。

假如说我要生成一张游戏的图片,4K的分辨率,每秒钟能输出60张图片,x就是那个4K分辨率的图片也就是800万像素。每一个像素是一个随机变量,X就是一个长为800万维的一个多维随机变量,每一个像素的值都是由后面的一个分布来控制就是P_{g}。定一个先验在一个输入的噪音变量上面,噪音变量是z,分布是P_{Z}, z可以认为比如说一个100维的向量,她每一个元素是一个均值为0,方差为1的高斯噪音,生成模型就是把z映射成x,生成模型是一个MLP,她有一个可学习的参数叫做\theta _{g},MLP理论上可以拟合任何一个函数,原先生成游戏的图片就是通过背后的代码控制一些变量生成的画面,生成模型就是不管代码而是估计一个差不多大小的向量,这个向量足以表达背后隐藏的一些逻辑。再学一个映射MLP,MLP理论上可以拟合任何一个函数。构造一个差不多大小的向量,这个多层感知机强行把这个z映射成我要的那些x,使得长得很像。

判别器有可学习的参数\theta _{d},判别器的作用就是把之前的800万像素的图片放进来输出一个标量,判断x是来自真实采样的数据还是生成出来的图片。如果来自于真实的数据就标1,来自于生成

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值