在上一节中可以看到基于”推土距离“的WGAN网络能够有效生成马图片,但是网络构造能力有所不足,因此导致有些图片模糊,甚至有些图片连马的轮廓都没有构建出来,本节我们改进WGAN网络,让它具有更强大的图像生成能力。
在介绍WGAN网络算法时提到,如果把网络看成一个函数,那么网络要想具备好的图像生成能力就必须满足1-Lipshitz条件,也就是要满足公式:
根据微积分的中值定理,如果函数f(x)可导,那么对任意x1,x2,可以找到位于(x1,x2)之间的x3,使得如下公式成了:
将它带入到上面公式就有:
这意味着如果函数满足1-Lipshitz条件,那么它必须在定义域内的没一点都可导,而且其求倒数后的结果绝对值不能大于1,这是一个相当苛刻的条件。所以上一节描述WGAN网络时,算法作者想不到好的办法让构造的网络满足这个条件,于是”拍脑袋“想出了将网络内部参数的数值全部剪切到(-1,1)之间,这也是造成网络生成图像质量不好的原因。
如果把函数f看做鉴别者网络,把输入的参数x看做是输入网络的图片,那么需要网络对所有输入图片求导后,所得结果求模后不大于1.这里需要进一步解释的是,由于图片含有多个像素点,如果把每一个像素点的值都看成是输入网络的参数,那么网络就是一个多元函数f(x1,x2,…xn),其中x1,x2…xn就是输入图片