【论文笔记】【cnn】ResNest详解

ResNest通过Split-Attention模块实现跨通道注意力,改进ResNet以适应多种视觉任务。它在图像分类、Faster R-CNN、DeeplabV3等任务上表现出色,如在MS-COCO实例分割中实现48.3%的框mAP和41.56%的掩码mAP。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

摘要:ResNest主要贡献是设计了一个Split-Attention模块,可以实现跨通道注意力。通过以ResNet样式堆叠Split-Attention块,获得了一个ResNet的变体。ResNest网络保留了完整的ResNet结构,可以直接用下游任务,而不会引起额外的计算成本。ResNest在分类、FasterRCNN、DeeplabV3上都有提升。

动机:著名的ResNet是针对图像分类设计的,对其他视觉任务的效果可能不是很好。在其他视觉任务中,使用图像金字塔或跨通道特征图注意力提高模型性能。因此ResNest希望能直接在backbone中实现跨通道的网络。

贡献:

1. 对ResNet进行修改,在单个网络内合并了特征图的拆分注意力。具体来说,把每个块的特征图分成几组(沿通道维度)和更细粒度的子组或分割,其中,每个组的特征表示是通过其分割表示的加权组合确定的。这个单元就是模块化的Split-Attention,通过叠加几个Split-Attention块,创建了一个类似ResNet的网络,即ResNest(S代表“split”)。

2. ResNest可用于图像分类、对象检测、实例分割、语义分割并取得良好的性能。在MS-COCO实例分割中,使用ResNeSt-101主干的Cascade-RCNN模型实现了48.3%的框mAP和41.56%的掩码mAP。我们的单个DeepLabV3 模型再次使用ResNeSt-101主干,在ADE20K场景解析验证集上的mIoU达到46.9%,比

评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值