FCN 全卷积网络
Fully Convolutional Networks for Semantic Segmentation
今天实验室停电,无聊把原来的一个分享PPT发上来
语义分割
语义分割是计算机视觉中的基本任务,也是计算机视觉的热点,在语义分割中我们需要将视觉输入分为不同的语义可解释类别,「语义Semantic Segmentation的可解释性」即分类类别在真实世界中是有意义的。
例如,我们可能需要区分图像中属于汽车的所有像素,并把这些像素涂成蓝色。与图像分类,语义分割使我们对图像有更加细致的了解。说白了,就是将图片上所有的像素点进行分类。
CNN与FCN
CNN这几年一直在驱动着图像识别领域的进步。无论是整张图片的分类,还是物体检测,关键点检测等都在CNN的帮助下得到了非常大的发展。
但是图像语义分割不同于以上任务,前面说了,需要预测一幅图像中所有像素点的类别,这是个空间密集型的预测任务。
传统用CNN进行语义分割的方法是“将像素周围一个小区域作为CNN输入,做训练和预测。这样做
- 存储开销大
- 计算效率低下,过多的重复计算
- 如何