我对BANet,SeMask的理解

本文介绍了两种先进的图像语义分割方法:BANet和SeMask。BANet通过双向感知网络解决城市场景分割问题;SeMask则首次研究了在预训练Transformer中加入语义上下文的效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、 BANet

1.创新点
  • 本文提出了一种双向感知网络(BANet),用于VFR(very fine resolution)城市场景图像的精确语义分割。
  • 与传统的单路径卷积神经网络不同,BANet通过构建两条特征提取路径并由一个特征聚合模块来处理来解决城市场景分割的难题。
2.模型结构

在这里插入图片描述
特征聚合模块:
在这里插入图片描述

二、SeMask

1.创新点
  • 是第一个研究添加 semantic context到预训练的transformer backbones对语义分割任务的效果的论文
  • 提出使用一个简单的semantic decoder来聚合来自编码器不同阶段的semantic priors
2.模型结构

在这里插入图片描述
在这里插入图片描述
在Swin Transformer层之后添加了一个带有SeMask块的语义层(图b),以捕获编码器网络中的语义上下文。
在这里插入图片描述

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值