论文阅读:Fully Convolutional Networks for Semantic Segmentation

本文介绍了FCN如何通过全卷积层替换全连接层,解决语义分割中输入图像尺寸固定的问题。FCN利用反卷积进行上采样,并引入跳跃结构融合不同层次的特征,提高了分割精度。在PASCAL VOC、NYUDv2和SIFT Flow数据集上,FCN展示了优秀的表现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1 摘要

之前的语义分割网络中,输入图像需要限定一个固定的尺寸,而且在经过多层卷积以后,提取的特征信息丢失严重。针对这些语义分割问题,本文提出一种叫“fully convolutional networks”的网络(下称FCN),该网络将传统CNN的全连接层改成全卷积层,支持输入任意尺寸的图片并且输出一定尺寸的图片。在这个网络中定义了一种跳跃结构将网络深层的粗糙的特征图与网络浅层精细的特征图进行融合,在PASCAL VOC数据集、NYUDv2数据集、SIFT Flow数据集中,在当时均表现SOTA(stateof-the-art(最好效果)的缩写)。

2 亮点

2.1 以全卷积层代替全连接层

2.1.1 支持任意不同尺寸图片的输入

在以前的CNN网络结构中,大多数都是在最后面的几层使用全连接层,而一方面全连接层网络的神经元数量是一定的,另一方面必须限定固定分辨率图片的输出,那么就使得输入图片尺寸必须是固定的,因为这样才能保证特征数量的一致。如下图为全连接层。
在这里插入图片描述
但是本文将全连接层直接改成n个1x1的卷积核,这样使得无论输入的尺寸为多大,经过n个1x1卷积以后,特征数量就会变成n有关,而与图片的尺寸无关。而如果是全连接层的话,参数数量是与图片的尺寸有关的,因为全连接层需要将一张axbxn的特征图转成为(

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值