点上方蓝字计算机视觉联盟获取更多干货
在右上方 ··· 设为星标 ★,与你不见不散
今天介绍一篇来自阿德莱德大学、亚洲微软研究院、北航的CVPR2019关于语义分割的论文。
本文研究了利用大型网络训练小型语义分割网络的知识提取策略。我们从简单的像素蒸馏方案开始,它将图像分类所采用的蒸馏方案应用于图像分类,并对每个像素分别进行知识蒸馏。基于语义分割是一个结构化的预测问题,我们进一步提出将结构化知识从大网络提取到小网络。我们研究了两种结构化的蒸馏方案:(i)成对蒸馏,提取成对的相似性;(ii)整体蒸馏,使用GAN提取整体知识。通过对三种场景解析数据集Cityscapes、Camvid和ADE20K的大量实验,验证了知识提取方法的有效性。
介绍
语义分割是预测输入图像中每个像素的类别标签的问题。它是计算机视觉中的一项基础性工作,具有自动驾驶、视频监控、虚拟现实等多种现实应用。自全卷积神经网络(FCNs)[38]问世以来,深度神经网络一直是语义分割的主流解决方案。随后的DeepLab[5,6,7,48]、PSPNet[56]、OCNet[50]、Re- fineNet[23]、DenseASPP[46]等方法在分割精度上都取得了显著的提高,但往往模型繁琐,计算费用昂贵。
近年来,由于在移动设备上的应用需要,模型尺寸小、计算量小、分割精