

deeplab_v3+设计了一种新的encoder-decoder结构
- encoder:deeplab_v3+使用deeplab_v3的结构作为encoder, encoding之后得到size = 1/16 input size的feature map
- decoder:以前的方法直接设计一个16倍的比linear upsampling layer作为decoder。在这里,我们首先对encoder的输出进行4倍的linearly upsampling。然后,我们从encoder部分提取同样size的feature map(low-level feature)和当前的feature map拼接。当然,这里我们先对low-level feature用1x1卷积进行降维,防止网络认为它的重要性超过encoder提取的丰富的语义信息,同时降低训练的复杂度。最后我们使用少量的3x3的conv进行refine 并再次进行4倍的linearly upsampling得到输出。
Deeplab_v3+采用一种新的encoder-decoder结构,encoder部分使用Deeplab_v3结构,输出特征图大小为输入的1/16;decoder部分先进行4倍线性上采样,再与低级特征融合,并经过3x3卷积和再次4倍上采样得到最终输出。
669

被折叠的 条评论
为什么被折叠?



