fcn语义分割 论文

本文深入探讨全卷积网络(FCN)如何解决固定输入尺寸的问题,通过将全连接层转换为卷积并结合上采样实现任意大小输入的语义分割。FCN保持了特征映射的空间结构,允许精确恢复目标位置。此外,文章还介绍了skip net结构,通过结合高层和低层特征来改善细节处理,提高语义分割的准确性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

全卷积网络:

个人认为本文主要是两个重点:

第一是fcn,全卷积网络(+上采样)

第二是skip net

首先说全卷积网络:

通常cnn在卷积层后会接上若干全连接层,但是全连接层和卷积层的连接数量是固定的,这也就导致了输入必须是固定的尺寸。如下图所示:

clipboard

但是在fcn中将fc用卷积取代,再加上采样层,这样能够输入任何大小的图片,同时输出图片相应大小的语义分割。如下图所示:

clipboard

可以看到两站图中的红色部分略有不同,这是因为第一幅图中通过全连接层,已经破坏了卷积层输出feature map的空间结构,而第二幅图中通过全卷积网络保持了feature map空间结构,在通过反卷积完全可以恢复原图像中目标的空间位置,也成为heat map。从下图中可以看出heat map中的标记与原图中cat的位置相似。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值