复旦大学提出SETR:基于Transformer的语义分割

复旦大学等单位的研究提出了SETR,将语义分割视为序列到序列任务,利用纯Transformer实现,无需卷积和分辨率降低。在ADE20K等数据集上取得SOTA性能,代码即将开源。SETR通过全局上下文建模提供强大的分割能力,挑战传统FCN架构。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文将语义分割视为序列到序列的预测任务,在ADE20K上排名第一!表现SOTA!性能优于OCNet、GCNet等和Axial-DeepLab-XL网络,代码即将开源!

PS:目前看来,目标检测、实例分割、语义分割主流CV方向均被Transformer"攻克"了

注:文末附【语义分割】和【Transformer】交流群

SETR

Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspective with Transformers

在这里插入图片描述

  • 作者单位:复旦, 牛津大学, 萨里大学, 腾讯优图, Facebook
  • 主页:https://fudan-zvg.github.io/SETR/
  • 代码:https://github.com/fudan-zvg/SETR
  • 论文:https://arxiv.org/abs/2012.15840

最新的语义分割方法采用具有编码器-解码器体系结构的全卷积网络(FCN)。编码器逐渐降低空间分辨率,并通过更大的感受野学习更多的抽象/语义视觉概念。由于上下文建模对于分割至关重要,因此最新的工作集中在通过扩张/空洞卷积或插入注意力模块来增加感受野。但是,基于编码器-解码器的FCN体系结构保持不变。

在本文中,我们旨在通过将语义分割视为序列到序列的预测任务来提供替代视角。具体来说,我们部署一个纯 transformer&#

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值