目录
一、理论部分
场景解析对于不受限制的开放词汇和多种场景具有挑战性。在本文中,我们利用金字塔池模块和提出的金字塔场景解析网络(PSPNet),利用基于不同区域的上下文聚合来挖掘全局上下文信息的能力。我们的全局先验表示可以有效地在场景解析任务中产生高质量的结果,而PSPNet为像素级预测提供了更好的框架。所提出的方法在各种数据集上实现了最先进的性能。在2016年ImageNet场景解析挑战赛、PASCAL VOC 2012基准测试和cityscape基准测试中获得第一名。单个PSPNet在PASCAL VOC 2012上的mIoU准确率为85.4%,在城市景观上的准确率为80.2%。
论文地址: