【论文笔记】【cnn】ResNest详解

最新推荐文章于 2024-03-22 09:44:46 发布

Chen_Swan

最新推荐文章于 2024-03-22 09:44:46 发布

阅读量6.2k

点赞数 1

分类专栏：计算机视觉 classfication

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Chen_Swan/article/details/105734396

版权

ResNest通过Split-Attention模块实现跨通道注意力，改进ResNet以适应多种视觉任务。它在图像分类、Faster R-CNN、DeeplabV3等任务上表现出色，如在MS-COCO实例分割中实现48.3%的框mAP和41.56%的掩码mAP。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

摘要：ResNest主要贡献是设计了一个Split-Attention模块，可以实现跨通道注意力。通过以ResNet样式堆叠Split-Attention块，获得了一个ResNet的变体。ResNest网络保留了完整的ResNet结构，可以直接用下游任务，而不会引起额外的计算成本。ResNest在分类、FasterRCNN、DeeplabV3上都有提升。

动机：著名的ResNet是针对图像分类设计的，对其他视觉任务的效果可能不是很好。在其他视觉任务中，使用图像金字塔或跨通道特征图注意力提高模型性能。因此ResNest希望能直接在backbone中实现跨通道的网络。

贡献：

1. 对ResNet进行修改，在单个网络内合并了特征图的拆分注意力。具体来说，把每个块的特征图分成几组（沿通道维度）和更细粒度的子组或分割，其中，每个组的特征表示是通过其分割表示的加权组合确定的。这个单元就是模块化的Split-Attention，通过叠加几个Split-Attention块，创建了一个类似ResNet的网络，即ResNest（S代表“split”）。

2. ResNest可用于图像分类、对象检测、实例分割、语义分割并取得良好的性能。在MS-COCO实例分割中，使用ResNeSt-101主干的Cascade-RCNN模型实现了48.3％的框mAP和41.56％的掩码mAP。我们的单个DeepLabV3 模型再次使用ResNeSt-101主干，在ADE20K场景解析验证集上的mIoU达到46.9％，比

最低0.47元/天解锁文章

评论 7

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。