一、 BANet
1.创新点
- 本文提出了一种双向感知网络(BANet),用于VFR(very fine resolution)城市场景图像的精确语义分割。
- 与传统的单路径卷积神经网络不同,BANet通过构建两条特征提取路径并由一个特征聚合模块来处理来解决城市场景分割的难题。
2.模型结构
特征聚合模块:
二、SeMask
1.创新点
- 是第一个研究添加 semantic context到预训练的transformer backbones对语义分割任务的效果的论文
- 提出使用一个简单的semantic decoder来聚合来自编码器不同阶段的semantic priors
2.模型结构
在Swin Transformer层之后添加了一个带有SeMask块的语义层(图b),以捕获编码器网络中的语义上下文。