FCN深度学习语义分割开山之作——学习笔记

《Fully Convolutional Networks for Semantic Segmentation》提出了首个端到端的针对像素级预测的全卷积网络(FCN),可直接处理任意大小的输入图像并输出相应大小的预测结果,超过了现有技术水平。

一、提出背景

传统的语义分割方法需要对每个像素进行分类,但计算成本高且复杂。该论文的目标是利用 FCN 实现端到端的像素级预测,以更高的效率达到更好的语义分割效果。

二、全卷积网络(FCN)的特点

全卷积网络通过移除全连接层,仅使用卷积层、池化层和激活函数,构建一个完全由卷积层组成的网络结构。由于没有固定的输入尺寸限制,FCN 可以接受任意大小的输入图像,并输出相应的像素级预测结果。

三、网络设计

提出了一种创新的 跳跃结构(skip architecture),将深层语义信息(表示语义的全局信息)与浅层外观信息(表示局部细节)结合。跳跃连接使得模型在预测过程中,不仅能捕获全局的语义信息,还能保留细粒度的空间信息,从而提高了分割精度。

在理解FCN的架构之前先回忆一下VGG的架构,如下图:

FCN就是将VGG后面的全连接层换成了卷积层,使VGG能够适用于语义分割领域,如下图所示:

1、跳跃连接

通过以下几种方式可以得到多尺度的特征图,将低层特征图(高分辨率但

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值