神经网络与深度学习(笔记四)

本文介绍了语义分割的基本概念,包括与实例分割和目标检测的区别。语义分割旨在对图像的每个像素进行分类。文章详细讨论了全卷积网络在语义分割中的应用,以及反卷积和反池化的作用,这些技术有助于提高分割效率和准确性。此外,还提到了跳跃结构在融合特征信息中的重要性,以及常用的FCN评价指标和标注工具,如ILabelme和EISeg。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、语义分割基本概念

1. 问题描述

语义分割:找到同一画面中的不同类型目标区域。(如下图所示)

 2. 语义分割与实例分割以及目标检测的区别

实例分割问题在于同一类型目标要分出来具体实例,目标检测问题在于标出外包围矩阵。(以下图为例)

 二、语义分割基本思想

1. 语义分割目标

对图中每一个像素进行分类,得到对应标签。

2.基本思想

I 滑动窗口

使用滑动窗口的方法,通过重复计算,实现语义分割。(以下图为例)

缺点:效率低下,重叠区域的特征反复被计算。

 II 全卷积

让整个网络只包含卷积层,并在网络中嵌入下采样和上采样过程。

全卷积网络结构:

网络结构分为全卷积和反卷积两个部分。全卷积部分借用了一些经典的CNN网络,并把最后的全连接层换成卷积,用于提取特征,形成热点图;反卷积部分则是将小尺寸的热点图上采样得到原尺寸的语义分割图像 。

三、反卷积与反池化

1. 反池化(上池化,unpooling)

反池化是池化的逆操作,最常见的反池化操作有反最大池化和反平均池化,其示意图如下:

2. 反卷积

反卷积是一种特殊的正向卷积,先按照一定的比例通过补 0 来扩大输入图像的尺寸,接着旋转卷积核,再进行正向卷积,示意图如下:

3. 跳跃结构

 用于融合高低层特征信息。通过跨层连接的结构,结合了网络浅层的细(fine-grain)粒度信息信息以及深层的粗糙(coarse)信息,以实现精准的分割任务。示意图如下:

 四、FCN评价指标与标注工具

1. 常见语义分割评价指标

 其中, 

2. 常见语义分割标注工具

 I Labelme:A image annotation software for 2D or 3D images.

II EISeg:基于飞桨开发的一个高效智能的交互式分割标注软件。涵盖了高精度和轻量级等不同方向的高质量交互式分割模型,方便开发者快速实现语义及实例标签的标注,降低标注成本。 另外,将EISeg获取到的标注应用到PaddleSeg提供的其他分割模型进行训练,便可得到定制化场景的高精度模型,打通分割任务从数据标注到模型训练及预测的全流程。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值