Deconvolution and Checkerboard Artifacts翻译

        承上文,本文根据文章的主要内容进行翻译,介绍反卷积的缺点及对应的解决方法。

        反卷积的结果中通常伴随着重叠区域的出现,并且对于两个维度的图像来说,重叠区域的不均匀性更加明显,如下图中阴影部分为重叠区域,黑色区域为不均匀的重叠效果。

上采样出现的棋盘格现象

 

图片来自这里

        通常上采样时,需要进行多次反卷积,这样不同尺度下的图片都会受其影响,导致最终生成的图片中颜色亮丽的地方尤为明显,因为网络的偏置导致生成的颜色较为平均。     

       那么如何避免反卷积带来的影响呢?

  • 根据滤波器大小,设置合理的步长。如gan网络最后一层的步长设置为1能弱化棋盘格的影响(参考该文献)。
  • 理论上可通过模型使不均匀的重叠位置变得均匀,不过操作中需要权衡一些因素,如限制了滤波器的一些可能值,牺牲了模型的性能等。实际上,模型不仅难以通过学习改变不均匀的重叠位置,还能将均匀的重叠位置变得不均匀。

        实际上,完全避免上述伪影(重叠位置)需要对滤波器进行严格的限制。尽管如此,生成的图片中还是会存在伪影。这可能也会由其他因素造成,如gan网络的判别器与其梯度,最主要的还是反卷积引起的。反卷积很脆弱,因为其很容易表示为伪影的目标函数。

        为更好的进行上采样,作者引出“转置卷积”。因为转置卷积不会默认生成伪影。其中一种使用的方法和反卷积差不多:设置滤波器大小为步长的整数倍;也可以先对图像进行插值,然后再进行卷积运算,这种和高分辨率重建的方法类似。并且作者利用最近邻插值然后卷积的方法,获得了最好的效果,解决了伪影的问题。

        最后是作者使用最近邻插值的实验结果,有如下几个结论:

  • 采用插值-卷积的模式工作时,层数越多,则伪影越弱。全部采用resize-conv而不用deconv时,没有伪影信息;
  • 训练前可判断伪影的不同,若随机初始化的生成器产生的图片由伪影,则表明伪影是生成图片的方式引起的,而不是gan网络训练的结果。这也意味着前期能学习一些好的生成器,而不需要等网络训练的周期;
  • 另外,伪影不是GAN的特例,风格迁移也会遇到相同的问题。将deconv替换为resize-conv模式时,伪影消失;
resize-conv消除伪影的例子

 

 

不同层使用resize-conv时的结果风格迁移是使用resize-conv消除伪影

参考文献:

  1. https://distill.pub/2016/deconv-checkerboard/

        

 

### 反卷积(去卷积)概念 反卷积操作,也被称为转置卷积,在计算机视觉和深度学习领域用于上采样过程。不同于标准卷积层减少输入尺寸并提取特征的能力,反卷积旨在增加空间维度的同时恢复细节[^1]。 具体来说,反卷积通过学习一组滤波器来放大图像大小,并且可以看作是传统卷积运算的一个逆向版本。然而值得注意的是,“反卷积”并不完全等于数学意义上的严格意义下的逆变换;而是指一种能够实现扩大输出尺度的操作方式[^2]。 ```python import torch.nn as nn class DeconvNet(nn.Module): def __init__(self): super(DeconvNet, self).__init__() self.deconv_layer = nn.ConvTranspose2d(in_channels=64, out_channels=32, kernel_size=3, stride=2, padding=1, output_padding=1) def forward(self, x): return self.deconv_layer(x) ``` 在这个例子中定义了一个简单的含有单个转置卷积层(`ConvTranspose2d`) 的神经网络模型 `DeconvNet` 。该层接受通道数为 64 的输入张量,并将其转换成具有 32 个通道的新表示形式,同时将高宽各方向上的分辨率加倍。 ### 应用场景 在实际应用方面,反卷积广泛应用于语义分割、超分辨率重建等领域。例如 U-Net 架构就利用了大量反卷积操作来进行医学像分析中的像素级分类任务。此外,在风格迁移算法里也会见到其身,用来逐步还原被压缩后的抽象表征至原始图片级别。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值