【论文阅读】基于双量程上下文聚合的遥感图像高效语义分割

该文提出了一种轻量级的双范围上下文聚合网络(LDCANet),用于遥感图像的高效语义分割。DCAM模块结合了卷积和自注意机制,捕获局部和全局信息,而ELB解码器利用MLP实现了低计算复杂度的信息聚合。实验在Vaihingen和GID数据集上展示了模型的有效性。

【论文阅读】基于双量程上下文聚合的遥感图像高效语义分割


Dual-Range Context Aggregation for Efficient Semantic Segmentation in Remote Sensing Images

摘要在遥感图像语义分割任务中引入自注意机制有利于建立远程依赖关系和挖掘全局上下文信息

轻量级的双范围上下文聚合网络(LDCANet)

双范围上下文聚合模块(DCAM)

对卷积和自关注获得的局部特征和全局语义上下文进行聚合

两个级联的线性层来实现,从而降低计算复杂度

基于多层感知器(MLP)的高效线性块(ELB)解码器

一、介绍


FCN被提出用于实现像素化预测和端到端语义分割训练

PSPNet提出了可变核大小的全局池化问题,以捕获不同区域的上下文信息

追求更轻量级的体系结构:

  • ENet[15]被提出通过压缩信道来减少网络参数。

  • 图像级联网络(Image cascade network, ICNet)[16]引入了级联特征融合来实现快速分割模型

卷积可以有效地捕获局部信息

语义分割依赖于对多层特征映射的远程建模

注意力机制具有捕获远程依赖关系和从整个图像建模全局信息的能力

一种自注意机制来捕捉图像的丰富对象上下文

作用:

  • DCAM将卷积和自关注获得的局部特征和全局语义上下文进行聚合
  • 多层感知器(MLP)的高效线性块(ELB)方法,对不同深度的信息进行聚合

二、相应模型


2.1 整体框架

LDCANet遵循简单而清晰的编码器-解码器结构

评论 2
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值