基于双注意力模块的FDA-DeepLab 语义分割网络
1.摘要
提出两个问题
1.针对 DeepLabv3 +对相似对象容易误判、小目标容易遗漏、预测输出存在空洞等问题
2.针对训练样本的非均衡性问题
训练数据中各种类别样本数量差别过大,导致训练的模型对各个类别预测或分类的精度偏差比较大,比如电池故障预测,故障的数据量远远少于正常数据量,但是这些故障数据反而更重要。
本文提出的解决方法
1.设计了一种结合通道注意力机制和空间注意力机制的特征融合模块
2.通过引入样本难度权重调节因子和类别权重改进了损失函数
2.引言
1.多层的连续池化和下采样操作,产生空间信息缺失的问题
2.介绍前人如果对该问题进行解决,主要是两大途径,一是空洞卷积的提出(扩大感受野),二是引入编码器-解码器结构
3.介绍本文研究方法
3.FDA-DeepLab网络
创新点:1.通道注意力模块和空间注意力模块融合使用。2.在交叉熵损失函数中引入权重系数,解决样本不均衡的问题。
焦点损失函数
通过损失函数来解决样本不平衡问题,我的理解就是通过某种方法使得不同类别的样本对于模型学习中的Loss(或梯度)贡献是比较均衡的。那么作者就是在原本的交叉熵函数中增添了一个权重调节因子( 1 - p t ) γ以抵消样本类别不平衡和样本分类难度不平衡的影响,从而提升模型精确度,其表达式为

双注意力模块结构:
<

本文提出了一种名为FDA-DeepLab的语义分割网络,该网络结合了通道注意力和空间注意力模块以解决DeepLabv3+中的误判和空洞问题,同时通过引入样本难度权重和类别权重改进了损失函数,以应对训练数据的非均衡性。实验表明,双注意力模块和焦点损失函数的使用显著提升了模型的精度,特别是在处理小目标和不平衡数据集时。
最低0.47元/天 解锁文章
2401





