一.提出背景
基于FCN全卷积网络的分割面临诸多问题,这篇文章从多尺度入手,提出了金字塔模型来提取多尺度的信息,达到了 State-of-the-art 的结果
论文:PSPnet:Pyramid Scene Parsing Network 【点击下载】
Caffe代码:【Github】
二.算法框架
算法细节比较多,这里我主要强调以下几个关键点:
1)通过多尺度 Pooling 的方式得到不同 Scale 的 Feature,Concat 得到判别的多尺度特征;

2)加入额外的深度监督 Loss

三.数据训练
1)下载