【东南大学学报 ( 自然科学版 )】基于双注意力模块的FDA-DeepLab 语义分割网络

本文提出了一种名为FDA-DeepLab的语义分割网络,该网络结合了通道注意力和空间注意力模块以解决DeepLabv3+中的误判和空洞问题,同时通过引入样本难度权重和类别权重改进了损失函数,以应对训练数据的非均衡性。实验表明,双注意力模块和焦点损失函数的使用显著提升了模型的精度,特别是在处理小目标和不平衡数据集时。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

基于双注意力模块的FDA-DeepLab 语义分割网络

1.摘要

提出两个问题

1.针对 DeepLabv3 +对相似对象容易误判、小目标容易遗漏、预测输出存在空洞等问题
2.针对训练样本的非均衡性问题
训练数据中各种类别样本数量差别过大,导致训练的模型对各个类别预测或分类的精度偏差比较大,比如电池故障预测,故障的数据量远远少于正常数据量,但是这些故障数据反而更重要。

本文提出的解决方法

1.设计了一种结合通道注意力机制和空间注意力机制的特征融合模块
2.通过引入样本难度权重调节因子和类别权重改进了损失函数

2.引言

1.多层的连续池化和下采样操作,产生空间信息缺失的问题
2.介绍前人如果对该问题进行解决,主要是两大途径,一是空洞卷积的提出(扩大感受野),二是引入编码器-解码器结构
3.介绍本文研究方法

3.FDA-DeepLab网络

创新点:1.通道注意力模块和空间注意力模块融合使用。2.在交叉熵损失函数中引入权重系数,解决样本不均衡的问题。

焦点损失函数

通过损失函数来解决样本不平衡问题,我的理解就是通过某种方法使得不同类别的样本对于模型学习中的Loss(或梯度)贡献是比较均衡的。那么作者就是在原本的交叉熵函数中增添了一个权重调节因子( 1 - p t ) γ以抵消样本类别不平衡和样本分类难度不平衡的影响,从而提升模型精确度,其表达式为
在这里插入图片描述

双注意力模块结构:

在这里插入图片描述

网络结构:

在这里插入图片描述

4.实验

4.1数据集的选择以及骨干网络的设置

数据集:PASCAL VOC 2012
骨干网络:DeepLab

4.2训练策略

这部分介绍了训练参数的设置以及优化器学习率的设置

4.3消融实验

4.3.1证明注意力模块的有效性

首先是原始网络的精度,然后分别加上空间注意力模块和通道注意力模块看看精度的提升,最后在把两个模块都加进去看最后的精度。实验表明双注意力通道的表现最好

4.3.2证明焦点损失函数的有效性

与只使用原始的交叉熵函数和使用焦点损失函数进行对比,实验发现,焦点损失函数的引入使得 MIoU在原始交叉熵损失的基础上提高了 0. 6% .

4.3.3证明特征融合模块的有效性

因为本文提出的网络结构是在4,8,16倍下采样的特征图都依次做了特征融合,那么作者就是分别只进行两次融合或者不融合,来证明三个阶段的融合是有必要的

4.4与目前先进的网络比较

在 PASCAL VOC 2012 验证集上的性能对比

5.总结

我认为这篇文章就是将空间和通道上下文信息交换结合起来了,在deeplab网络上增加一个模块得到了一点精度的提升,理解起来不太难。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值