由8月14日组会讨论时觉得,tph-yolov5的小目标检测头较为重要,是从低层特征图进行检测的结果。但将C3模块更换为C2f模块,是否对低层特征图有较好改善仍有疑问,因此一个优质低层特征图应该有助于进行目标检测。基于这一想法,我们想到了华为的VanillaNet,是一个结构简单轻巧的模型,设想为若其模型性能够好,将其作为Backbone,其低层级特征图应有更好表现。目前VannillaNet模型与YOLO检测算法的结合未见有直接更换Backbone的,后续仍可调研。
从YOLO系列模型改进指南这一博客可以看到,目前网络上对于YOLO系列的改进各种教程已经层出不穷,让人看起来眼花缭乱,其内有众多改进方法,及B站教程。但觉得除去此类方法,还可以直接对目前小目标相关文章直接进行调研。
觉得基于注意力机制与超分算法的小目标检测其实是一种更好的小目标检测算法。
疑问
ROI是如何获得的?
把DETR的Object Query定义为可学习的Anchor如何理解?
VanillaNet
论文名称:VanillaNet: the Power of Minimalism in Deep Learning
论文地址:https://arxiv.org/abs/2305.12972
代码地址:https://github.com/huawei-noah/VanillaNet 或
https://gitee.com/mindspore/models/tree/master/research/cv/vanillanet
VanillaNet在yolov8中的应用
在首发Yolov8涨点神器:华为诺亚2023极简的神经网络模型 VanillaNet—VanillaBlock助力检测,实现暴力涨点博客中,他将yolov8 Neck部分P3 P4 P5位置的C2f更换成了VanillaNetBlock。给出了代码,但是并没有给出实验结果。
小目标检测网络结构优化方法
1.用Bi-FPN替换PAN-Net
Bi-FPN是在EfficientDet中提出了一种加权的双向特征金字塔网络,它允许简单和快速的多尺度特征融合。目的是为了追求更高效的多尺度融合方式。
2.关于增加小目标检测头的思考,小目标检测头可以直接提升对于小目标检测的性能,但其原因真的是低层特征图具备较好的小目标检测性或是因为FPN结构融合后有较好的检测性能,觉得仍然有待讨论。
觉得基于注意力机制与超分算法的小目标检测其实是一种更好的小目标检测算法。
DETR系列算法调研
DETR
DETR算法组成部分:
1.CNN