CMLFormer: CNN and Multiscale Local-Context Transformer Network for Remote Sensing Images Semantic Segmentation
CMLFormer:CNN和多尺度局部上下文变换网络用于遥感图像语义分割
论文地址
代码地址
这篇论文是一篇OA的,但是里面有些知识点是我不了解的,所以还是吧这篇论文看了。
1. 介绍
-
本文提出了一种CMLFormer网络架构,该架构在编解码结构中结合轻量级CNN和多尺度局部上下文Transformer,通过较低的计算开销有效融合遥感图像分割中的全局与局部信息。
-
设计了一种高效灵活的多尺度局部上下文Transformer模块(MLTB),通过结合非重叠块自注意力机制与多尺度策略,以低计算复杂度建立像素间的长程依赖关系,从而捕捉遥感图像的全局上下文信息。
-
提出特征增强模块(FEM)以缓解遥感图像分割中长程依赖建模过程中局部上下文细节的丢失问题。
本文其余部分组织如下:第二节分析相关研究工作,第三节阐述本文研究方法,第四节通过实验对比与消融实验验证所提模型的鲁棒性,最后第五节总结全文。
2. 网络结构

上面是该网络的模型图,在编码器阶段,使用了轻量级的 ResNet-18网络架构以低复杂度提取图像

最低0.47元/天 解锁文章
1239

被折叠的 条评论
为什么被折叠?



