[论文阅读]面向全局:用于高分辨率遥感图像语义分割的宽上下transforms

提出WiCoNet模型,结合CNN与Transformer优势,有效解决高分辨率遥感图像语义分割问题,并引入新BLU数据集验证模型效果。

[论文阅读]面向全局:用于高分辨率遥感图像语义分割的宽上下transforms

一、总体介绍

Looking Outside the Window: Wide-Context Transformer for the Semantic Segmentation of High-Resolution Remote Sensing Images

  远程上下文信息是高分辨率遥感图像语义分割的关键。

  我们提出了一种宽上下文网络(WiCoNet)用于HR RSIs的语义分割,上下文转换器扩展了视觉转换器这一新兴神经网络,用于双分支语义关联的建模。

  提出了一个新的北京土地利用(BLU)数据集。


二、具体作用

在本研究中,目标是同时利用CNN和对transforms HR RSIs进行语义分割,作用在于:

  • cnn善于保存空间信息
  • Transformer则能够更好地建模远程依赖关系

  WiCoNet包括两个cnn,分别从本地和全局图像级别提取特征。这使WiCoNet能够同时考虑本地细节和广域上下文。

  SE块将全局信息聚合并嵌入到特征中,学习不同图像场景中的偏焦点,这在后来的文献中通常被称为通道注意,通道注意和非局部注意块依次用于增强空中rsi中的远程依赖性

Transformer的演变介绍:

  • Transformer最初是为自然语言处理任务引入的,在那里它实现了最先进的性能

  • Pure Transformer可以取代CNN进行图像识别任务

  • Transformer进行密集分类任务,提出了一种用于泛视分割的双路径转换器,其中包括用于分割的像素路径和用于类预测的存储路径


## 三、WiCoNet模型构建

3.1 总体框架

  我们提出了一种WiCoNet,它利用了rsi中更大图像范围中的远程

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值