[论文阅读]面向全局:用于高分辨率遥感图像语义分割的宽上下transforms
文章目录
一、总体介绍
Looking Outside the Window: Wide-Context Transformer for the Semantic Segmentation of High-Resolution Remote Sensing Images
远程上下文信息是高分辨率遥感图像语义分割的关键。
我们提出了一种宽上下文网络(WiCoNet)用于HR RSIs的语义分割,上下文转换器扩展了视觉转换器这一新兴神经网络,用于双分支语义关联的建模。
提出了一个新的北京土地利用(BLU)数据集。
二、具体作用
在本研究中,目标是同时利用CNN和对transforms HR RSIs进行语义分割,作用在于:
- cnn善于保存空间信息
- Transformer则能够更好地建模远程依赖关系
WiCoNet包括两个cnn,分别从本地和全局图像级别提取特征。这使WiCoNet能够同时考虑本地细节和广域上下文。
SE块将全局信息聚合并嵌入到特征中,学习不同图像场景中的偏焦点,这在后来的文献中通常被称为通道注意,通道注意和非局部注意块依次用于增强空中rsi中的远程依赖性
Transformer的演变介绍:
-
Transformer最初是为自然语言处理任务引入的,在那里它实现了最先进的性能
-
Pure Transformer可以取代CNN进行图像识别任务
-
Transformer进行密集分类任务,提出了一种用于泛视分割的双路径转换器,其中包括用于分割的像素路径和用于类预测的存储路径
## 三、WiCoNet模型构建
3.1 总体框架
我们提出了一种WiCoNet,它利用了rsi中更大图像范围中的远程

提出WiCoNet模型,结合CNN与Transformer优势,有效解决高分辨率遥感图像语义分割问题,并引入新BLU数据集验证模型效果。
最低0.47元/天 解锁文章
5266

被折叠的 条评论
为什么被折叠?



