PSPNet:
Pyramid Scene Parsing Network (2017)
PDF: https://arxiv.org/pdf/1612.01105.pdf
PyTorch: https://github.com/shanglianlm0525/PyTorch-Networks
特点:
- 能够有效的得到像素级场景标注的全局上下文信息, pyramid pooling module 集合不同 levels 的信息,比 global pooling 具有更好的特征表示能力了;
pyramid pooling module 进行了四种不同的 pyramid scales,再进行特征融合
a. 红色部分是 global pooling 生成一个单元格输出;
b. pyramid level 将 feature map 分成不同的子区域,并得到不同位置的 pooled 特征表示.
c. 不同 levels 的输出包含了不同尺寸的 feature map; 四个 level 的