什么是语义分割?
语义分割就是从像素水平上理解、识别图片的内容。输入的是图片,输出的是同尺寸的分割标记,每个像素会被标识为一个类别。
语义分割的用处:
·机器人视觉和场景理解
·辅助/自动驾驶
·医学X光
一、简介
FCN是深度学习用于语义分割任务的开山之作,提出了“全卷积神经网络”,将全连接层替换为卷积层的end-to-end的全卷积网络,可以适应任意尺寸的输入,在不破坏空间结构的基础上,可以对图像进行像素级别的分类。解决了降采样后的低分辨率问题。
FCN采用反卷积层对最后一个卷积层的热力图进行上采样,使它恢复到输入图像相同的尺寸,从而可以对每个像素都产生了一个预测,通过逐个像素地求其在1000张特征图(1000个通道、1000个类别)上,该像素位置的最大数值描述(概率)作为该像素的分类,也就是求每个像素的所属类别,损失函数是在最后一层的特征图上各像素的损失之和。
二、FCN-反卷积
反卷积更倾向于称为转置卷积。反卷积核是卷积核的转置,学习率为0。如下图:
方法一: