【论文阅读】基于双量程上下文聚合的遥感图像高效语义分割
Dual-Range Context Aggregation for Efficient Semantic Segmentation in Remote Sensing Images
摘要在遥感图像语义分割任务中引入自注意机制有利于建立远程依赖关系和挖掘全局上下文信息
轻量级的双范围上下文聚合网络(LDCANet)
双范围上下文聚合模块(DCAM)
对卷积和自关注获得的局部特征和全局语义上下文进行聚合
两个级联的线性层来实现,从而降低计算复杂度
基于多层感知器(MLP)的高效线性块(ELB)解码器
一、介绍
FCN被提出用于实现像素化预测和端到端语义分割训练
PSPNet提出了可变核大小的全局池化问题,以捕获不同区域的上下文信息
追求更轻量级的体系结构:
-
ENet[15]被提出通过压缩信道来减少网络参数。
-
图像级联网络(Image cascade network, ICNet)[16]引入了级联特征融合来实现快速分割模型
卷积可以有效地捕获局部信息
语义分割依赖于对多层特征映射的远程建模
注意力机制具有捕获远程依赖关系和从整个图像建模全局信息的能力
一种自注意机制来捕捉图像的丰富对象上下文
作用:
- DCAM将卷积和自关注获得的局部特征和全局语义上下文进行聚合
- 多层感知器(MLP)的高效线性块(ELB)方法,对不同深度的信息进行聚合
二、相应模型
2.1 整体框架
LDCANet遵循简单而清晰的编码器-解码器结构

该文提出了一种轻量级的双范围上下文聚合网络(LDCANet),用于遥感图像的高效语义分割。DCAM模块结合了卷积和自注意机制,捕获局部和全局信息,而ELB解码器利用MLP实现了低计算复杂度的信息聚合。实验在Vaihingen和GID数据集上展示了模型的有效性。
最低0.47元/天 解锁文章
663





