RT-DETR改进策略【Conv和Transformer】| ICCV-2023 iRMB 倒置残差移动块轻量化的注意力模块

Limiiiing

已于 2024-12-03 21:37:26 修改

阅读量603

点赞数 4

CC 4.0 BY-SA版权

分类专栏： RT-DETR改进专栏文章标签：深度学习 RT-DETR 计算机视觉目标检测

于 2024-11-28 13:54:52 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_42591591/article/details/144103683

RT-DETR改进专栏专栏收录该内容

该专栏为热销专栏榜第5名

163 篇文章 ¥99.90 ¥299.90

订阅专栏

一、本文介绍

本文记录的是利用iRMB模块优化RT-DETR的目标检测网络模型。iRMB（Inverted Residual Mobile Block）的作用在于克服了常见模块无法同时吸收CNN 效率建模局部特征和利用Transformer 动态建模能力学习长距离交互的问题。相比一些复杂结构或多个混合模块的方法，能更好地权衡模型成本和精度。本文将其用于RT-DETR的模型改进和二次创新，更好地突出重要特征，提升模型性能。

专栏目录：RT-DETR改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进

专栏地址：RT-DETR改进专栏——以发表论文的角度，快速准确的找到有效涨点的创新点！

二、iRMB注意力介绍

Rethinking Mobile Block for Efficient Attention-based Models

2.1 设计出发点

统一CNN和Transformer优势：从高效的Inverted Residual Block（IRB）和Transformer的有效组件出发，期望在基础设施设计层面整合两者优势，为注意力模型构建类似IRB的轻量级基础结构。
解决现有模型问题：当前方法存在引入复杂结构或多个混合模块的问题，不利于应用优化。希望通过重新思考IRB和Transformer组件，构建简单有效的模块。

2.2 原理

基于Meta Mobile Block（MMB）：MMB是通过对MobileNetv2中的IRB和Transformer中的核心MHSA及FFN模块重新思考并归纳抽象得到的。它以参数化的扩展比率λ和高效算子F来实例化不同模块（如IRB、MHSA、FFN），揭示了这些模块的一致本质表达。

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Limiiiing 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。