李沐《动手学深度学习》学习笔记(四)

语义分割是一种对图像中每个像素进行分类的技术,不同于实例分割和目标检测。FCN作为全卷积神经网络,解决了传统方法中计算量大、效率低的问题。它由全卷积部分和反卷积部分组成,前者用于特征提取,后者用于上采样恢复原始尺寸,实现像素级的分类。训练结果显示FCN能有效进行图像语义分割。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

九、语义分割

1.概述

什么是语义分割问题:找到同一画面中的不同类型目标区域

与其他问题有何区别?

实例分割:同一类型目标要分出来具体实例(谁是谁)

目标检测:标出来外包围矩形

2.语义分割基本思想

语义分割的目标就是对图中每一个像素进行分类,得到对应标签。基本思想就是滑动窗口,返回每个窗口处的标签。但是这样做的话,滑动次数太多,计算太慢,而且进行了大量的重复计算。

3.FCN网络

FCN网络(全卷积神经网络)中全是卷积层链接,与CNN网络的主要区别在于FCN将CNN中的全连接层换成了卷积操作。换成全卷积操作后,没有了全连接层的输入层神经元个数的限制,所以卷积层的输入可以是不同尺寸的图像,不用要求训练图像和测试图像size一致。

其结构分为两个部分:全卷积部分和反卷积部分。全卷积部分借用了一些经典的CNN网络,并把最后的全连接层换成卷积,用于提取特征,形成热点图;反卷积部分则是将小尺寸的热点图上采样得到原尺寸的语义分割图像。

4.FCN网络结构

卷积部分:

 FCN中第6、7、8层都是通过1 × 1卷积得到的,第6层的输出是4096 × 7 × 7, 第7层的输出是4096 × 7 × 7 ,第8层的输出是1000 × 7 × 7,即1000个大小是 7 × 7的特征图

反卷积部分:

蓝色:卷积层;绿色:Max Pooling层;黄色: 求和运算;灰色: 裁剪

 4.训练结果

 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值