2.2 Laplacian Pyramid
金字塔是线性可逆图像表示法,包含一系列带通图像,之间间隔八度,外加一个低频残差。令d(.)表示下采样,该操作使j*j的图像I模糊并变小,因此d(I/2)是大小为j/2*j/2大小的新图像。
令u(.)表示上采样,该操作使I变得平滑并且增大为原来的2倍大小,即U(I)是大小为2j*2j的新图像。
构建高斯金字塔 G(I)=[I0,I1, …,Ik],其中I0=I, Ik表示第k次对I使用下采样d(.)操作的结果。 K是金字塔的级数,需要选择K以使最后一层的空间大小非常小(小于8*8像素).
拉普拉斯金字塔 L(I)中每一层k的系数hk,是通过把高斯金字塔相邻层的差分来构造的,对其中较小的一个图形用上采样u(.)操作来扩充,这样两幅图的大小才匹配:
直观地说,每层捕捉特定尺度的图像结构。拉普拉斯金字塔的最后一层不再是一个差分图像,而是与高斯金字塔最后一层图像相同的低频残差图像,也就是说,hk= Ik。
从一个拉普拉斯金字塔系数[h1,…hk]重构是一个逆推的过程。
由Ik= hk 开始,重构到 I= I0. 也就是说,从最粗糙的层级,上采样和与残差图像h相加的操作,获得下一层的图像,如此重复,直到获得全分辨率图像。
2.3 拉普拉斯金字塔GAN
模型组合了条件GAN和拉普拉斯金字塔表示。首先考虑采样过程。接下来的训练中(后面解释),有一系列的生成卷积网络(convnet)模型 {G0,…,GK},每个模型捕捉自然图像的拉普拉斯金字塔一个差分层的系数hk的分布。对图像的采样与公式4所示的重构过程类似,区别在于用生成模型来产生hk:
循环起始于设置,最后一个层级的模型是GK, GK利用噪声向量ZK产生残差图像,即:。注意,除最后一个层级