语义分割(FCN,UNET,DEEPLAB)

本文介绍了语义分割领域的三种关键技术:FCN、UNET和DEEPLAB。FCN通过全卷积网络和反卷积层实现像素级别的分类。UNET采用编码器-解码器结构,通过skip connection融合高低层次特征。DEEPLAB系列则引入空洞卷积和ASPP模块,解决多尺度问题,提升分割精度。

语义分割(FCN,UNET,DEEPLAB)

语义分割的目的是对图像中的每一个像素点进行分类,从而确定每个像素点所属的类别。(从像素级别进行分类)

1.FCN(Fully Convolustional Networks)

VGG和Resnet等CNN网络通过在网络最后加入全连接层,然后再经过softmax获得类别的概率信息,得到的一维概率信息可以对整张图片的类别进行识别。FCN提出将网络后边的全连接层全部换成卷积,从而得到二维的特征图(feature map),使用反卷积层对特征图进行上采样,恢复到与图像相同的尺寸,从而对每一个像素均产生一个预测结果,进而解决分割问题(FCN是在抽象的特征图中恢复每个像素的类别)。
在这里插入图片描述
FCN的结构和操作流程如下:
在这里插入图片描述

  • 首先使用全卷积提取特征(虚线以上部分),图中的蓝色快为卷积块,绿色块为max pooling块。输入可以为任意尺寸的彩色图像,输出图像的尺寸与输入尺寸相同。
  • 然后分别从卷积网络的不同阶段预测分类结果(虚线以下部分),原始图片经过多层卷积与池化操作后,得到的图像越来越下,分别率越来越低,图像最小时被称为Heatmap热图(即特征图)。使用反卷积操作对特征图进行上采样,直到恢复到与输入图像相同的尺寸,从而对每个像素产生预测。假设输入图像大小为nnc,类别数为C,那么恢复的图像大小为nnC,通过逐个像素地求其在C张图像的该像素的最大数值描述(概率)作为该像素的分类。也就说最后恢复的图像已经被分类完成。<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

space_dandy

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值