RT-DETR改进专栏
文章平均质量分 97
本专栏会持续复现顶会,以及一些最新的模块调用,用于改进RT-DETR的测试精度。RT-DETR目前的相关改进发文量较少,易于发文。本专栏力求详细明了,以论文的角度,手把手的教程专为学习,改进RT-DETR模型算法的同学设计,欢迎大家订阅。
余额抵扣
助学金抵扣
还需支付
¥99.90
¥299.90
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
Limiiiing
YOLO系列,RT-DETR模型、多模态融合改进。专栏内所有文章均配置完整代码和详细步骤,亲测可行,快速涨点。订阅专栏享受改进,写作,选刊等答疑内容,助力科研,发文无忧。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
RT-DETR改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
1️⃣本专栏已更新260多种不同的改进方法,所使用并改进的每一个模块均包含详细的模块分析、原理讲解、个人总结、多种改进方式以及完整的修改流程,所有改进100%可直接运行。2️⃣所有改进点均为近三年顶会,顶刊提出的先进算法,将其融入到中,紧跟学术热点,适应不同的任务场景。3️⃣团队内发表数篇SCI论文,熟悉完整的发表流程,订阅专栏即可进群享受模型训练、模型改进、论文写作、投稿选刊,从入门到论文的各种答疑内容。4️⃣专栏内容会持续更新,最近更新时间:2024-12-4。项目介绍在大家购买专栏后,加入学习原创 2024-12-03 20:39:23 · 20037 阅读 · 78 评论
-
RT-DETR改进入门篇 | 手把手讲解改进模块如何实现高效涨点,以SimAM注意力模块为例
本文记录的是基于SimAM注意力模块的RT-DETR目标检测方法研究。SimAM注意力模块通过优化能量函数来获得每个神经元的三维权重,而或增加计算复杂度。若是有轻量化需求的小伙伴,无参的注意力模块也许是一个不错的选择。原创 2024-11-29 09:12:07 · 2707 阅读 · 4 评论
-
RT-DETR改进策略【卷积层】| DWRSeg :高效获取多尺度上下文信息,涉及resnet18、resnet50、rtdetr-l
本文记录的是利用DWR 模块改进 RT-DETR 的特征提取部分。(Dilation-wise Residual)通过两步残差流程(区域残差化-语义残差化)与分支化空洞卷积结合,引导解码器处理特征与跳接特征的多尺度精准融合。本文利用模块,通过区域残差化生成简洁区域型特征图以简化融合基础,再通过分支化空洞卷积捕捉多尺度空间上下文,同时依托残差连接保留原始特征信息,对RT-DETR中不同尺度目标特征进行针对性强化、抑制无效背景特征干扰,在特征融合阶段实现多尺度语义与细节信息的高效互补,避免传统多感受野卷积的冗余原创 2025-12-09 15:32:21 · 216 阅读 · 0 评论 -
RT-DETR改进策略【Neck】| CVPR2024 LGAG:大核分组注意力门模块,3×3分组卷积与注意力协同的特征精准融合
本文记录的是利用LGAG 模块改进 RT-DETR 的颈部融合部分。(Large-kernel Grouped Attention Gate)通过3×3分组卷积与注意力机制结合,引导解码器处理特征与跳接特征的精准融合。本文利用模块,通过3×3分组卷积扩大感受野以捕捉更广泛局部空间上下文,同时结合注意力机制生成自适应注意力系数,对YOLOv10中关键目标特征赋予高激活值、抑制冗余背景特征,在特征融合阶段实现全局语义与局部细节的高效结合,减少计算成本的同时提升特征表达能力,增强模型对复杂场景下目标的检测精度与效原创 2025-11-20 12:42:05 · 325 阅读 · 0 评论 -
RT-DETR 一键输出FPS、层数、参数量、计算量、模型大小、推理延时
在官方项目中,使用val接口可输出模型的层数、参数量、计算量。而与推理速度相关的评价指标中,只提供了前处理、推理和后处理的耗时,并且是一次推理的的耗时,而。本文通过预热、取平均,可。原创 2025-11-06 08:46:47 · 266 阅读 · 0 评论 -
RT-DETR改进策略【Neck】| CVPR 2024 EUCB 高效的上采样卷积块:轻量级上采样 + 深度卷积增强 + 通道匹配
本文记录的是利用EUCB模块对RT-DETR的颈部网络进行改进的方法研究。采用传统的标准3×3卷积结合上采样的方法进行特征分辨率匹配与增强,可能因计算成本过高限制模型在资源受限场景的应用,且单纯上采样易导致特征模糊,影响模型在目标检测任务中的特征融合效果。通过“上采样+3×3深度卷积+1×1点卷积”的轻量架构进行特征处理,既能大幅降低计算成本,又能通过深度卷积捕捉局部特征、保留关键语义信息,提升颈部网络特征融合效率与模型检测性能。EMCAD:Efficient Multi-scale Convolution原创 2025-10-31 16:47:21 · 401 阅读 · 0 评论 -
RT-DETR改进策略【卷积层】| YOLO-MS中的MSBlock:分层多分支 + GQL 引导,多尺度特征增强与污染空间信息过滤
本文记录的是利用YOLO-MS中的MSBlock优化RT-DETR。的结构融合了“分层多分支特征提取”与“全局查询动态引导”两大核心机制,通过、(GQL)机制及模块(IBM/SIBM),实现差异化多尺度特征提取与污染空间信息过滤,完成特征多样性增强与定位精度优化。在加入 中以后,通过改进原模型的基础模块,构建含 3 条差异化感受野的分支,同时集成 GQL 机制动态平衡各分支权重、适配 HKS 协议在不同阶段选择异质卷积核,并保留原模型的特征融合路径以维持特征传递连续性,实现全局跨阶段信息引导与局部细粒度特原创 2025-10-14 15:15:07 · 384 阅读 · 0 评论 -
RT-DETR改进策略【卷积层】| DEConv: 强度信息与梯度特征融合的细节增强 适用于小目标与细节目标检测任务
本文记录的是利用 模块优化 的目标检测网络模型。(Detail-Enhanced Convolution,细节增强卷积)的设计旨在,解决 目标检测网络中传统普通卷积缺乏目标细节相关先验、对小目标边缘、目标与背景边界等关键细节捕捉能力不足的问题,同时避免引入额外参数量与计算开销,以适配 对实时推理性能与检测精度的双重需求。DEA-Net: Single image dehazing based on detail-enhanced convolution and content-guided atte原创 2025-09-20 12:42:26 · 630 阅读 · 0 评论 -
RT-DETR改进策略【卷积层】| CVPR 2025:动态双曲正切(Dynamic Tanh,DyT)模块,维持模型性能与训练稳定性
本文记录的是利用模块优化的目标检测网络模型。DyT(Dynamic Tanh,动态双曲正切模块) 的设计旨在,替代归一化层,在无需计算激活统计量的情况下实现对极端值的压缩和输入的动态缩放。本文将深入研究的原理,并将其应用到中,通过以元素级操作替换归一化层、保留非线性压缩特性,维持模型性能与训练稳定性。Transformers without Normalization归一化层在现代神经网络中应用广泛,被视为训练深度网络的关键组件。然而,研究发现Transformer中的层归一化(LN)层映射输入到输出的曲线原创 2025-08-29 16:51:21 · 408 阅读 · 0 评论 -
RT-DETR改进策略【RT-DETR和Mamba】| CVPR 2025:EfficientViM 压缩隐藏状态空间进行通道混合、单头设计减少内存操作,提升目标检测效率与精度
本文记录的是利用模块优化的目标检测网络模型。EfficientViM Block(基于隐藏状态混合器的状态空间对偶性模块) 的设计旨在,提升特征提取效率,同时兼顾全局依赖捕捉与局部细节保留。本文将深入研究的原理,并将其应用到中,通过重构特征提取流程、减少内存绑定操作、融合多阶段特征,增强模型在资源受限环境下的检测性能与速度。Depth Information Assisted Collaborative Mutual Promotion Network for Single Image DehazingLE原创 2025-08-25 10:10:31 · 556 阅读 · 0 评论 -
RT-DETR改进策略【卷积层】| CVPR 2024:LEGM 局部特征嵌入全局特征提取 适用于低质量图像特征提取任务
本文记录的是利用模块优化的目标检测网络模型。LEGM(Local Feature-Embedded Global Feature Extraction Module,局部特征嵌入的全局特征提取模块) 的设计旨在,增强特征表示能力,同时捕捉局部细节与全局依赖。本文将深入研究的原理,并将其应用到中,通过融合局部与全局特征、引入深度信息,增强特征表示能力。Depth Information Assisted Collaborative Mutual Promotion Network for Single Ima原创 2025-08-03 21:27:51 · 381 阅读 · 0 评论 -
RT-DETR改进策略【Neck】| SDFM 表层细节融合模块,利用通道-空间注意力机制,实现深层与浅层特征融合,抑制噪声干扰
本文记录的是利用SDFM 模块改进 RT-DETR 的颈部融合部分。SDFM模块(Surface Detail Fusion Module,表层细节融合模块) 通过在特征提取网络的浅层引入通道-空间注意力机制,动态生成深层与浅层特征融合权重。该模块可自适应保留不同模态中的独特信息,抑制背景噪声与光照干扰,实现低层细节的精准对齐与互补增强,为后续检测提供高保真度的底层特征表示,从而提升模型在复杂场景下的目标检测鲁棒性与定位准确性。Rethinking the necessity of image fusion原创 2025-07-11 08:33:28 · 454 阅读 · 0 评论 -
RT-DETR改进策略【Neck】| PSFM,深层语义融合模块 引入深层与浅层交叉注意力机制,动态建模不同层级的全局语义依赖关系
本文记录的是利用PSFM 模块改进 RT-DETR 的颈部融合部分。PSFM模块(Profound Semantic Fusion Module,深层语义融合模块) 通过在特征提取网络的深层引入跨模态交叉注意力机制,动态建模红外与可见光特征的全局语义依赖关系。本文将其应用到的颈部部分,融合深层与浅层特征,捕捉长距离语义关联,增强融合特征的判别性与场景理解能力,为检测头提供包含全局上下文的高层语义表示,从而提升模型在复杂场景下的目标检测准确率与语义推理鲁棒性。Rethinking the necessity原创 2025-07-08 08:29:40 · 590 阅读 · 0 评论 -
RT-DETR改进策略【Neck】| BMVC 2024 MASAG 模块(多尺度自适应空间注意门):动态感受野与空间注意力增强多尺度目标检测精度
本文主要利用MSA2NetMSA^{2}NetMSA2Net 中的 MASAG 模块优化 RT-DETR 的目标检测网络模型。(Multi - Scale Adaptive Spatial Attention Gate) 模块通过动态调制空间注意力权重与多尺度感受野,实现了对跨层级特征图中局部细节与全局语义的智能聚合。将其应用于的改进过程中,针对目标检测中浅层边界特征与深层语义信息的互补性需求,增强对多尺度目标的特征表达能力,提升复杂场景下的检测精度与边界定位准确性。MSA^2Net: Multi-scal原创 2025-06-22 10:30:00 · 540 阅读 · 0 评论 -
RT-DETR改进策略【Neck】| CVPR 2024 MFM(Modulation Fusion Module,调制融合模块):动态特征加权融合,突出关键特征抑制冗余
本文主要利用DCMPNet中的 MFM 模块优化 RT-DETR 的目标检测网络模型。模块通过动态调制特征融合过程,实现了对多尺度、跨层级特征的智能聚合。将其应用于的改进过程中,针对目标检测中边界特征与语义信息的互补性需求,缓解网络中浅层细节与深层语义融合不足的问题。Depth Information Assisted Collaborative Mutual Promotion Network for Single Image Dehazing在图像去雾网络中,不同层级和类型的特征包含着互补的信息(如浅层原创 2025-06-15 11:30:00 · 599 阅读 · 0 评论 -
RT-DETR改进策略【损失函数篇】| AAAI 2025 SD Loss,基于目标尺度动态调整尺度损失和位置损失的影响系数,减少 IoU 标签波动
在红外小目标检测任务里,基于交并比的损失存在波动问题,像边界框(BBox)标签的IoU损失波动最高可达86%,较小目标的IoU损失稳定性更差,严重影响模型稳定性和回归效果。同时,现有损失函数没有充分考虑不同目标尺度下对尺度和位置的敏感度差异,,并且掩码标签的位置损失在处理漏检物体时难以收敛,容易产生误报。这些问题限制了模型在不同尺度目标上的检测性能,为解决这些问题,提出了损失函数。原创 2025-06-10 08:34:30 · 716 阅读 · 0 评论 -
RT-DETR改进策略【卷积层】| AAAI 2025 FBRT-YOLO 应用RT-DETR 加强跨层特征融合能力与多尺度适应性,含 l 和 resnet18 两个版本
FBRT - YOLO是一种用于实时航拍图像检测的模型,其模型结构包含两个核心的轻量级模块,在航拍图像检测任务中展现出了良好的性能。原创 2025-06-07 10:39:20 · 1008 阅读 · 0 评论 -
RT-DETR改进策略【Backbone/主干网络】| CVPR 2025 替换骨干为MambaOut,去除冗余结构,挖掘视觉Mamba潜力
MambaOut是一种基于Gated CNN块构建的模型,其设计出发点基于对Mamba模型特性及视觉任务特点的深入分析,在结构上有独特之处,并展现出多方面优势。原创 2025-06-04 13:10:23 · 834 阅读 · 2 评论 -
RT-DETR改进策略【Conv和Transformer】| IJCAI 2024 利用FreqFormer中的SFA 空间 - 频率注意力 二次改进HGBlock、ResNetLayer
本文记录的是利用 SFA 空间 - 频率注意力(Spatial-Frequency Attention)和 CTA 通道转置注意力(Channel Transposed Attention)模块优化 RT-DETR的目标检测网络模型。和源自图像超分辨率领域的模型,前者结合高频和通道信息到自注意力中,后者从通道维度进行自注意力计算,二者结合能够有效处理复杂的图像信息。本文将其应用到中,并进行,使网络能够综合空间、频率和通道等多种维度信息,更好地突出重要特征,从而提升对不同尺度目标和不规则形状目标的特征提取能力原创 2025-05-31 10:30:00 · 227 阅读 · 0 评论 -
RT-DETR改进策略【Conv和Transformer】| IJCAI 2024 利用FreqFormer中的CTA 通道转置注意力 二次改进HGBlock、ResNetLayer
本文记录的是利用 SFA 空间 - 频率注意力(Spatial-Frequency Attention)和 CTA 通道转置注意力(Channel Transposed Attention)模块优化 RT-DETR的目标检测网络模型。和源自图像超分辨率领域的模型,前者结合高频和通道信息到自注意力中,后者从通道维度进行自注意力计算,二者结合能够有效处理复杂的图像信息。本文将其应用到中,并进行,使网络能够综合空间、频率和通道等多种维度信息,更好地突出重要特征,从而提升对不同尺度目标和不规则形状目标的特征提取能力原创 2025-05-24 16:18:00 · 497 阅读 · 0 评论 -
RT-DETR改进策略【Backbone/主干网络】| CVPR 2024 替换骨干为InceptionNeXt,将大核深度卷积分解为四个并行分支,平衡速度与精度
InceptionNeXt是一种新型的卷积神经网络,旨在解决大核卷积神经网络在速度和性能之间的平衡问题。它的设计出发点基于对现有模型的分析和改进需求,结构上有独特的创新,这些设计为模型带来了显著的优势。原创 2025-05-23 09:09:02 · 518 阅读 · 0 评论 -
RT-DETR改进策略【卷积层】| AAAI 2025 风车状卷积PConv,实现感受野的高效扩张
本文记录的是利用风车卷积改进RT-DETR的目标检测网络模型。在红外小目标检测任务中,传统卷积方式难以捕捉目标像素的空间特征,影响检测性能,因此需要更适配的卷积方式提升特征提取能力。但不同尺度的红外小目标对特征提取需求有差异,为了更好地满足这些需求,本文利用模块改进,使模型能够更精准地对齐红外小目标像素的高斯空间分布,在增强底层特征提取的同时显著扩大感受野,使网络更好地适应不同尺度红外小目标的检测需求。Pinwheel-shaped Convolution and Scale-based Dynamic L原创 2025-05-12 10:58:12 · 994 阅读 · 0 评论 -
RT-DETR改进策略【Neck】| ACMMM 2024 WFU:小波特征上采样 | 通过小波变换的频率分解与跨尺度融合机制,解决传统上采样过程中的混叠和细节丢失问题
WFU模块通过小波变换的频率分解与跨尺度融合机制,解决了传统上采样过程中的混叠和细节丢失问题,实现了高效、高保真的面部细节重建。其轻量化设计和强泛化能力使其成为提升人脸超分辨率模型性能的关键组件,尤其在平衡计算效率与重建质量方面表现突出。原创 2025-04-28 12:34:19 · 763 阅读 · 0 评论 -
RT-DETR改进策略【Backbone/主干网络】| 替换骨干为PoolFormer,基于平均池化的Token混合器,通过聚合局部邻域特征实现信息交互
本文记录的是基于PoolFormer的RT-DETR骨干网络改进方法研究。提出了创新的MetaFormer通用架构,通过极简单的池化操作实现Token混合,能以低参数和计算成本高效捕捉图像全局与局部特征。将应用到的骨干网络中,通过其分层结构和Token混合机制,实现精度与效率的平衡优化。本文在的基础上配置了原论文中, , , , 五种模型,以满足不同的需求。MetaFormer Is Actually What You Need for Vision在计算机视觉领域,Transformer模型取得了显著成功原创 2025-04-28 12:25:22 · 393 阅读 · 0 评论 -
RT-DETR在新版本的ultralytics项目包如何配置添加新的模块(base_modules、repeat_modules)
本文主要讲解RT-DETR如何在8.3.65版本以后的ultralytics项目包中配置添加新的模块。本文使用的是最新版 8.3.103。原创 2025-04-19 08:34:07 · 970 阅读 · 0 评论 -
RT-DETR改进策略【Neck】| SEAM:分离和增强注意模块,解决复杂场景下的小目标遮挡问题
本文记录的是利用 SEAM 模块优化 RT-DETR 的目标检测网络模型。的设计出发点在于解决复杂场景下的人脸遮挡问题,相当于是小目标被其他物体部分遮挡时,传统方法因特征缺失导致检测精度下降的问题。该模块通过增强未遮挡区域的特征响应并补偿被遮挡区域的信息损失,提升模型对遮挡小目标的检测能力。YOLO-FaceV2: A Scale and Occlusion Aware Face DetectorSEAM模块(Separated and Enhancement Attention Module)的设计出发点原创 2025-04-17 09:33:01 · 1044 阅读 · 0 评论 -
RT-DETR改进策略【卷积层】| RFEM:感受野增强模块, 解决多尺度目标检测中因感受野不足导致的小目标信息丢失问题
RFE模块(Receptive Field Enhancement Module)的设计出发点是解决多尺度人脸检测中因感受野不足导致的小目标信息丢失问题。传统特征金字塔网络(如FPN)在处理小尺度人脸时,多次卷积操作会导致浅层特征的空间信息逐渐丢失,而深层特征虽语义丰富但空间分辨率较低。RFE模块通过引入扩张卷积,在不增加计算量的前提下扩大有效感受野,增强模型对不同尺度人脸的特征表达能力。原创 2025-04-17 09:32:39 · 848 阅读 · 0 评论 -
RT-DETR改进策略【Conv和Transformer】| HiLo注意力机制 通过分离处理图像的高频和低频信息,高效处理图像特征
本文记录的是利用改进检测模型,针对目标检测中面临的多尺度特征融合效率与长距离依赖建模难题,HiLo注意力模块的引入旨在通过频率解耦策略优化高分辨率特征处理,将高频细节(如目标边缘)与低频语义(如场景结构)分离建模,提升目标检测精度。Fast Vision Transformers with HiLo AttentionHiLo注意力模块的提出源于对传统自注意力机制局限性的反思。传统多头自注意力(MSA)在处理高分辨率图像时存在以下问题:HiLo将注意力模块分为高频(Hi-Fi)和低频(Lo-Fi)两个分支,原创 2025-04-14 08:48:12 · 543 阅读 · 0 评论 -
RT-DETR改进策略【独家融合改进】| U-Net V2 + 小目标检测头,加强跨尺度的上下文特征融合,提高小目标检测能力
P3/8 - small检测头原始模型中的P3/8特征层对应的检测头主要用于检测相对较小的目标。其特征图大小相对较大,空间分辨率较高。适合检测尺寸大概在8x8到32x32像素左右的目标。P4/16 - medium检测头这个检测头对应的P4/16特征层经过了更多的下采样操作,相比P3/8特征图空间分辨率降低,但通道数增加,特征更抽象且有语义信息。它主要用于检测中等大小的目标,尺寸范围大概在32x32到64x64像素左右。P5/32 - large检测头P5/32。原创 2025-03-19 09:04:05 · 960 阅读 · 0 评论 -
RT-DETR改进策略【独家融合改进】| AssemFormer + HS-FPN 减少目标尺度变化影响,增加多尺度的学习能力
HS - FPN结构由特征选择模块和特征融合模块组成。特征选择模块中,CA模块先处理输入特征图,经池化激活函数确定各通道权重以过滤特征图DM模块再对不同尺度特征图降维;特征融合模块中,利用SFF机制以高级特征为权重筛选低级特征语义信息后融合,提升模型检测能力。原创 2025-03-19 08:49:17 · 495 阅读 · 0 评论 -
RT-DETR改进策略【独家融合改进】| SPD-Conv+PPA 再次提升模型针对小目标的特征提取能力
SPD-Conv是一种新的 CNN 构建模块,用于替代传统 CNN 架构中使用的步长卷积(strided convolution)和池化(pooling)层,它由空间到深度(Space-to-depth,SPD)层和非步长卷积(non - strided convolution)层组成。原创 2025-03-16 14:48:22 · 832 阅读 · 0 评论 -
RT-DETR改进策略【独家融合改进】| RepVit+ASF-YOLO,轻量提点,适用专栏内所有的骨干替换
本文记录的是基于RepVit的RT-DETR轻量化改进方法研究。通过分离的和减少推理时的计算和内存成本,同时减少扩展比率并增加宽度,降低延迟,并通过加倍通道来弥补参数大幅减少的问题,提高了准确性。在此基础之上,将的颈部网络改进成的结构,使模型能够有效的融合多尺度特征,捕获小目标精细信息,并根据注意力机制关注小目标相关特征,显著提高模型精度。在计算机视觉领域,设计轻量化模型对于在资源受限的移动设备上实现视觉模型的部署至关重要。近年来,轻量级Vision Transformers(ViTs)在移动设备上表现出优原创 2025-03-16 14:48:01 · 818 阅读 · 0 评论 -
RT-DETR计算COCO指标和TIDE指标,小目标检测必备,更全面的评估和指导模型性能,包含完整步骤和代码
COCO指标能够直观了解模型在目标时的效果;TIDE指标专注于对进行分类和分析,从揭示模型的性能问题,使模型评估更加全面和深入(本文提供了完整的实现代码和配置步骤)。例如,论文中COCO的指标内容展示:论文中TIDE。原创 2025-03-15 12:13:15 · 732 阅读 · 7 评论 -
RT-DETR改进策略【SPPF】| 将特征金字塔池化修改为:SPPELAN ,多尺度特征提取与高效特征融合
本文记录的是。通过与,提升模型检测精度和鲁棒性。原创 2025-03-10 22:35:29 · 591 阅读 · 0 评论 -
RT-DETR改进策略【SPPF】| 将特征金字塔池化修改为:SPPCSPC,提升模型的特征提取能力和计算效率。
本文记录的是。YOLOv7中的SPPCSPC(Spatial Pyramid Pooling Cross Stage Partial Connections)模块是一种结合了(SPP)和(CSP)的改进结构,本文将其添加到RT-DETR中,原创 2025-03-10 22:35:04 · 426 阅读 · 4 评论 -
RT-DETR改进策略【独家融合改进】| 模型轻量化二次改进:StarNet + FreqFusion,极限降参,适用专栏内所有轻量化模型
FreqFusion是一种旨在解决密集图像预测任务中特征融合问题。原创 2025-03-04 09:29:42 · 946 阅读 · 0 评论 -
RT-DETR改进策略【独家融合改进】| MobileNetV4+BiFPN,轻量化+加权特征融合,轻松实现降参涨点
可扩展的高效物体检测BiFPN(加权双向特征金字塔网络)原创 2025-03-04 09:20:31 · 769 阅读 · 0 评论 -
RT-DETR改进策略【独家融合改进】| Mamba-YOLO+SDI 增强长距离依赖,聚焦目标特征
ODMamba骨干网络:由Simple Stem和Downsample Block组成。Simple Stem采用两个步长为2、内核大小为3的卷积,替代传统ViTs中用内核大小为4、步长为4的卷积划分图像块的方式,在性能和效率间达成平衡。Downsample Block包含ODSSBlock和Vision Clue Merge模块,先通过ODSSBlock学习特征,再经Vision Clue Merge模块下采样。原创 2025-02-25 12:52:24 · 831 阅读 · 0 评论 -
RT-DETR模型应用过程中的报错处理及疑问解答,涉及环境搭建、模型训练、模块改进、论文写作
本文记录了RT-DETR模型的这一系列过程中可能发生的问题,以及大家非常关心的问题,这里统一做了一个记录和解答。原创 2025-02-18 14:16:43 · 1366 阅读 · 1 评论 -
RT-DETR改进策略【模型轻量化】| EMO:ICCV 2023,结构简洁的轻量化自注意力模型
EMO模型旨在为移动应用设计高效的基于注意力的轻量级模型,在多个视觉任务上取得了优异的性能。原创 2025-01-24 09:58:32 · 713 阅读 · 0 评论
分享