一、本文介绍
本文记录的是利用YOLO-MS中的MSBlock优化YOLOv13。
MSBlock的结构融合了“分层多分支特征提取”与“全局查询动态引导”两大核心机制,通过分层多分支结构、全局查询学习(GQL)机制及倒置瓶颈模块(IBM/SIBM),实现差异化多尺度特征提取与污染空间信息过滤,完成特征多样性增强与定位精度优化。在加入 YOLOv13 中以后,通过改进原模型的 DSC3k2 基础模块,构建含 3 条差异化感受野的分支,同时集成 GQL 机制动态平衡各分支权重、适配 HKS 协议在不同阶段选择异质卷积核,并保留原模型的特征融合路径以维持特征传递连续性,实现全局跨阶段信息引导与局部细粒度特征、多尺度高 - 低阶语义信息的互补感知。
专栏目录:YOLOv13改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
文章目录
二、MSBlock模块原理介绍
YOLO-MS: Rethinking Multi-Scale Representation Learning for Real-time Object Detection
2.1 设计出发点
MSBlock的提出旨在解决现有实时目标检测器基础模块(如CSP、ELAN、Res2Net)在多尺度特征学习中的两大核心问题:
- 分支特征同质化,多尺度信息不足
主流模块(CSP、ELAN)的分支特征存在冗余和同质化问题(文档1中图1的特征可视化与D值分析显示,其分支间特征多样性低),无法有效捕捉不同尺度物体的细粒度与粗粒度信息,限制多尺度检测性能。 - 污染空间信息干扰,检测精度受损
Res2Net虽通过分层多分支结构提升了特征多样性,但会引入与目标无关的“污染空间信息”(文档1中图1可视化),导致模型对目标的定位准确性下降,反而影响检测效果。
因此,MSBlock的设计目标是:在提升分支特征多样性以增强多尺度信息的同时,减少污染空间信息,实现“高效多尺度特征学习”与“精准目标定位”的平衡。
2.2 模块结构
2.2.1 输入特征变换与分组
- 设输入特征为
订阅专栏 解锁全文
288






