学习视频:【手把手带你实战YOLOv5-进阶篇】YOLOv5 模型结构与构建原理_哔哩哔哩_bilibili
1、models/yolov5*.yaml 模型结构配置文件
nc:最终分类类别(用的coco数据集,默认80,可以不修改会自动匹配)
depth_multiple:重复次数×模型深度因子后四舍五入后与1去最大值
width_multiple:原始输出通道数×模型宽度因子后取相差最小的8的倍数
[from, number, module, args]
from:当前层输入从哪来(-1:上一层)
number:当前层重复次数
model:使用的模块名称(Conv:卷积层)
args:模块参数;(Conv:[输出通道数、卷积核大小、步幅、填充]
C3:[输出通道数、是否使用残差链接])
SPPF:[输入通道数、池化核大小]
nn.Upsample:[输入通道数、缩放因子、上采样方式]
Concat:[拼接维度]
# 0-P1/2
# 当前网络层编号-金字塔网络中层数/图片大小缩小的倍数
# 17 (P3/8-small)
# 当前网络层编号 (金字塔网络中层数/下采样倍数-检测目标大小)
# (small:小目标;medium:中等目标;large:大目标)
2、model/yolo.py 网络结构传参细节
类别自动更新:
if nc and nc != self.yaml['nc']:
LOGGER.info(f"Overriding model.yaml nc={self.yaml['nc']} with nc={nc}")
self.yaml['nc'] = nc # override yaml value
添加自定义模块:
ch[f]:上一层输入args:模型文件中 [from, number, module, args] 的args
# 设定模块时,c2必须单独设置,在parse_model中,c2用来记录输出维度,存入ch中。
当自定义模块中,如果存在输入输出维度时,要使用gw调整输入输出维度。
if c2 != no: # if not output c2 = make_divisible(c2 * gw, 8)