目标检测算法之YOLOv5计算预选框、详解anchor计算
- 单节段目标检测算法中:预选框的设定直接影响最终的检测精度
- 众所周知,yolov5中采用自适应调整预选框anchor的大小,但万事开头难,配置文件config中的预设还是很重要
- yolo算法作为one-stage领域的佼佼者,采用anchor-based的方法进行目标检测,使用不同尺度的anchor直接回归目标框并一次性输出目标框的位置和类别置信度。
- 下边根据最近的调研做出这块的一个详细总结:
1.YOLOv5网络结构
- yolov5中使用的coco数据集输入图片的尺寸为
640x640
,但是训练过程的输入尺寸并不唯一,因为v5可以采用masaic
增强技术把4张图片的部分组成了一张尺寸一定的输入图片。但是如果需要使用预训练权重,最好将输入图片尺寸调整到与作者相同的尺寸,而且输入图片尺寸必须是32
的倍数,这与下面anchor
检测的阶段有关。
- 当我们的输入尺寸为640*640时,会得到3个不同尺度的输出:80x80(640/8)、40x40(640/16)、20x20(640/32),即上图中的CSP2_3模块的输出。 </