基于双注意力模块的FDA-DeepLab 语义分割网络
1.摘要
提出两个问题
1.针对 DeepLabv3 +对相似对象容易误判、小目标容易遗漏、预测输出存在空洞等问题
2.针对训练样本的非均衡性问题
训练数据中各种类别样本数量差别过大,导致训练的模型对各个类别预测或分类的精度偏差比较大,比如电池故障预测,故障的数据量远远少于正常数据量,但是这些故障数据反而更重要。
本文提出的解决方法
1.设计了一种结合通道注意力机制和空间注意力机制的特征融合模块
2.通过引入样本难度权重调节因子和类别权重改进了损失函数
2.引言
1.多层的连续池化和下采样操作,产生空间信息缺失的问题
2.介绍前人如果对该问题进行解决,主要是两大途径,一是空洞卷积的提出(扩大感受野),二是引入编码器-解码器结构
3.介绍本文研究方法
3.FDA-DeepLab网络
创新点:1.通道注意力模块和空间注意力模块融合使用。2.在交叉熵损失函数中引入权重系数,解决样本不均衡的问题。
焦点损失函数
通过损失函数来解决样本不平衡问题,我的理解就是通过某种方法使得不同类别的样本对于模型学习中的Loss(或梯度)贡献是比较均衡的。那么作者就是在原本的交叉熵函数中增添了一个权重调节因子( 1 - p t ) γ以抵消样本类别不平衡和样本分类难度不平衡的影响,从而提升模型精确度,其表达式为
双注意力模块结构:
网络结构:
4.实验
4.1数据集的选择以及骨干网络的设置
数据集:PASCAL VOC 2012
骨干网络:DeepLab
4.2训练策略
这部分介绍了训练参数的设置以及优化器学习率的设置
4.3消融实验
4.3.1证明注意力模块的有效性
首先是原始网络的精度,然后分别加上空间注意力模块和通道注意力模块看看精度的提升,最后在把两个模块都加进去看最后的精度。实验表明双注意力通道的表现最好
4.3.2证明焦点损失函数的有效性
与只使用原始的交叉熵函数和使用焦点损失函数进行对比,实验发现,焦点损失函数的引入使得 MIoU在原始交叉熵损失的基础上提高了 0. 6% .
4.3.3证明特征融合模块的有效性
因为本文提出的网络结构是在4,8,16倍下采样的特征图都依次做了特征融合,那么作者就是分别只进行两次融合或者不融合,来证明三个阶段的融合是有必要的
4.4与目前先进的网络比较
在 PASCAL VOC 2012 验证集上的性能对比
5.总结
我认为这篇文章就是将空间和通道上下文信息交换结合起来了,在deeplab网络上增加一个模块得到了一点精度的提升,理解起来不太难。