Ultralytics YOLOv8 中目标检测模型训练的 imgsz
参数和推理时 imgsz
参数的关系,以及相关的常见问题。
1. imgsz
参数在训练和推理中的作用与关系
imgsz
(image size) 是一个核心参数,用于设定输入到网络中的图像尺寸。
-
训练时 (Training):
imgsz
定义了训练过程中输入模型的图像分辨率。 无论你的原始数据集图像尺寸有多大,YOLOv8 都会将它们统一缩放到这个指定的尺寸再送入网络进行训练。- 这个缩放过程通常会保持图像原有的长宽比,不足的部分会用灰色像素进行填充(这个过程称为 letterbox padding),以确保最终图像符合
imgsz
的正方形或矩形尺寸。 imgsz
的值必须是模型步长(stride,通常是 32)的倍数。
-
推理时 (Inference/Prediction):
imgsz
指定了在进行预测时,输入图像被缩放到的尺寸。- 关系: 推理时的
imgsz
可以与训练时的imgsz