【论文阅读】RRM:一个端到端的弱监督语义分割方法
Reliability Does Matter: An End-to-End Weakly Supervised Semantic Segmentation Approach
弱监督语义分割是一项具有挑战性的任务,因为它只需要图像级信息作为训练的监督
像素级预测用于测试
最先进的方法提出采用两步解决方案
- 学习生成伪像素级掩码,
- 使用fcn训练带有伪掩码的语义分割网络
生产高质量的伪掩模时采用各种技巧
利用图像级标签来生成可靠的像素级注释,并设计了一个完全端到端网络来学习预测分割图
图像分类分支为标注的类别生成类激活图
类别被进一步修剪成有效但微小的对象/背景区域
一、介绍
弱监督语义分割提供了比采用像素级掩码的完全监督语义分割更简单的方法
因为语义标签和像素之间没有直接的映射
一步法分割精度往往完全低于完全监督
为了产生高质量的伪掩码
例如以离线方式从对象建议中引入额外的对象/背景线索
一个是使用图像级注释生成伪像素级掩码,另一个是生成语义分割结果
通过增加一个额外的CRF操作,这些区域可以进一步修剪成更可靠的区域
设计了一种正则化损失,称为密集能量损失,它与逐像素的交叉熵损失相配合来优化训练过程
RRM在Pascal VOC val和测试集上分别达到了62.6和62.9的mIoU分数
二、联系工作
提出了第一个用于语义分割的全卷积网络FCN
WSSS:
- 是基于类激活图(CAM) (Zhou et al. 2016),即从图像级注释生成初始对象种子或区

本文介绍了一种名为RRM的弱监督语义分割方法,通过生成高质量的伪像素级掩码和利用类别激活图,实现了一种全卷积网络的端到端学习。实验结果显示在PascalVOC数据集上取得了显著性能。
最低0.47元/天 解锁文章
1349






