栗子 发自 凹非寺
量子位 报道 | 公众号 QbitAI
古往今来,大家都知道:只要图像一平移,CNN就认不出来了。
原因就在降采样身上。不管是最大池化,跨步卷积,还是平均池化,都对平移太敏感:
比如,0、0、1、1、0、0、1、1……这样的周期,最大池化是这样:
但如果平移一格,最大池化完全变了一个样子:
虽然,有著名的抗锯齿 (Anti-Aliasing,AA) 方法,致力解决这个问题。但把这种模块直接插进网络,会严重影响模型的表现。
现在,来自Adobe的Richard Zhang (简称“理查”) ,让抗锯齿和各种降采样和平共处了。
在保留平移不变性的情况下,还能提升ImageNet上的分类准确率。VGG、ResNet、DenseNet……各种架构都适用。
不止如此, 面对其他干扰更稳定了,如旋转如缩放;面对输入图像的损坏,还更鲁棒了。