感觉都是为了产生多尺度的特征再concatenate,就是一个是通过卷积,一个是通过池化。ASPP跟她们的区别呢?
题主说的没错, 它们都可以实现多尺度 (多感受野尺寸) 的特征输出, 下面分析它们的由来:
池化层输出的感受野由其输入的感受野和特征步长, 以及池化层的 核尺寸 共同决定.
卷积层输出的感受野由其输入的感受野和特征步长, 以及卷积层的 核尺寸 和 膨胀系数 共同决定.
所以一个输入要想得到多尺度 (多感受野尺寸) 的输出, 方法可能有 (不全):
- 经过不同 核尺寸 (和相应的 填充尺寸) 的 池化层, 融合它们的输出特征, 此对应于 SPP (Spatial Pyramid Pooling).
- 经过不同 膨胀系数 (和相应的 填充尺寸) 的 卷积层, 融合它们的输出特征, 此对应于 ASPP (Atrous Spatial Pyramid Pooling).
- 经过不同 核尺寸 (和相应的 填充尺寸) 的 卷积层, 融合它们的输出特征, 此对应于简化版的 Inception Module.
- 先经过不同 步长 的卷积层或池化层, 再归一化到相同的尺寸进行融合 (可联想到 FPN, PANet 等 cross-scale feature fusion 方案).
- 上述方法的组合.
作者:采石工
链接:https://www.zhihu.com/question/494598512/answer/2194330159
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。