目标检测算法之YOLOv5计算预选框、详解anchor计算
- 单节段目标检测算法中:预选框的设定直接影响最终的检测精度
- 众所周知,yolov5中采用自适应调整预选框anchor的大小,但万事开头难,配置文件config中的预设还是很重要
- yolo算法作为one-stage领域的佼佼者,采用anchor-based的方法进行目标检测,使用不同尺度的anchor直接回归目标框并一次性输出目标框的位置和类别置信度。
- 下边根据最近的调研做出这块的一个详细总结:
1.YOLOv5网络结构
- yolov5中使用的coco数据集输入图片的尺寸为
640x640,但是训练过程的输入尺寸并不唯一,因为v5可以采用masaic增强技术把4张图片的部分组成了一张尺寸一定的输入图片。但是如果需要使用预训练权重,最好将输入图片尺寸调整到与作者相同的尺寸,而且输入图片尺寸必须是32的倍数,这与下面anchor检测的阶段有关。

- 当我们的输入尺寸为640*640时,会得到3个不同尺度的输出:80x80(640/8)、40x40(640/16)、20x20(640/32),即上图中的CSP2_3模块的输出。 </
文章详细介绍了YOLOv5中预选框(anchor)的作用和计算方法。在YOLOv5网络结构中,不同尺度的特征图对应不同大小的anchor,用于检测不同大小的目标。训练时,YOLOv5会根据数据集自动检查并可能调整anchor,确保最佳召回率。计算过程涉及到kmean聚类方法。最后,文章还提到了检测模块如何利用这些anchor进行目标框的回归计算。
订阅专栏 解锁全文
601

被折叠的 条评论
为什么被折叠?



