本文介绍
为提升 YOLOv8 在目标检测任务中的特征表达能力,本文借鉴 TPAMI2025 Hyper-YOLO 所提出的Mix Aggregation Network(MANet)模块改进YOLOv8的C2f模块。 MANet融合了三种经典的卷积变体:1x1卷积、深度可分离卷积及C2f模块,从而有效提升了了Backbone的特征提取能力。实验结果如下(本文通过VOC数据验证算法性能,epoch为100,batchsize为32,imagesize为640*640):
| Model | mAP50-95 | mAP50 | run time (h) | params (M) | interence time (ms) |
|---|---|---|---|---|---|
| YOLOv8 | 0.549 | 0.760 | 1.051 | 3.01 | 0.2+0.3(postprocess) |
| YOLO11 | 0.553 | 0.757 | 1.142 | 2.59 | 0.2+0.3(postprocess) |
| YOLOv8_C2f-MANet | 0.572 | 0.782 | 1.402 | 3.59 | 0.4+0.3(postprocess) |

重要声明:本文改进后代码可能只是并不适用于我所使用的数据集,对于其他数据集可能存在有效性。
本文改进是为了降低最新研究进展至YOLO的代码迁移难度,从而为对最新研究感兴趣的同学提供参考。
代码迁移
重点内容
步骤一:迁移代码
ultralytics框架的模块代码主要放在ultralytics/nn文件夹下,此处为了与官方代码进行区分,可以新增一个extra_modules文件夹,然后将我们的代码添加进入。
下面代码可以加入
block.py文件中,因为其本质上就是对C2f模块的改进。
具体代码如下:
class MANet(nn.Module):
def __init__(self, c1, c2, n=1, shortcut=False, p=1, kernel_size=3, g=1, e=0.5):
super().__init__()
self.c = int(c2 * e)
self.cv_first = Conv(c1, 2 * self.c, 1, 1)
self.cv_final = Conv((4 + n) * self.c, c2, 1)
self.m = nn.ModuleList(Bottleneck(self.c, self.c, shortcut, g, k=((3, 3), (3, 3)), e=1.0) for _ in range(n))
self.cv_block_1 = Conv(2 * self.c, self.c, 1, 1)
dim_hid = int(p * 2 * self.c)
self.cv_block_2 = nn.Sequential(Conv(2 * self.c, dim_hid, 1, 1), GroupConv(dim_hid, dim_hid, kernel_size, 1),
Conv(dim_hid, self.c, 1, 1))
def forward(self, x)<

最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



