可视化CNN网络看到反卷积,很是困惑,发现其实Deconvolution有两种说法:
1. Backward Deconvnet
2. Transposed Convolution
一:Backward Deconvnet
论文参考:STRIVING FOR SIMPLICITY: THE ALL CONVOLUTIONAL NET
如下图(c) backward 'deconvnet' 所示,本质上是修改了反向传播中激活函数的梯度求导方式。
正常的反向传播中,输入特征大于0的值对应的梯度可以被反向传递回去。
反卷积的反向传播中,计算得到的梯度值大于0的可以被反向传递回去。
导向反向传播中,上述两个条件都要满足,也就是输入特征大于0的值对应的大于0的梯度可以被反向传递回去。
代码可以参考:https://nbviewer.jupyter.org/github/1202kbs/Understanding-NN/blob/master/3.1%20Deconvolution.ipynb。
可以看到_DeconvReluGrad被重新定义了:
@ops.RegisterGradient("DeconvRelu")
def _Dec