1. 获得最佳训练效果的建议
在大多数情况下,只要数据集足够大且标记良好,无需更改模型或训练设置即可获得良好的结果。如果一开始没有得到好的结果,可以采取一些步骤来改进,但官方总是建议用户在考虑任何更改之前首先使用所有默认设置进行训练。这有助于建立基本标准并找出需要改进的地方。
结果图(训练损失、val 损失、P、R、mAP)、PR 曲线、混淆矩阵、训练马赛克,测试结果和数据集统计图像都位于project/name目录中,通常是yolov5/runs/train/exp
数据集制作
- 每个班级的图像。每类≥1.5k 图像
- 每个类的实例。每类总计≥10k 个实例(标记对象)
- 图像多样性。必须代表已部署的环境。对于实际用例,我们推荐来自一天中不同时间、不同季节、不同天气、不同光照、不同角度、不同来源(在线抓取、本地收集、不同相机)等的图像。
- 标签一致性。所有图像中所有类的所有实例都必须标记。部分标签将不起作用。
- 标签准确性。标签必须紧密地包围每个对象。对象与其边界框之间不应存在空间。任何对象都不应缺少标签。
- 背景图片。背景图像是没有对象的图像,这些图像被添加到数据集中以减少误报 (FP)。我们推荐使用 0-10% 左右的背景图片来帮助减少 FPs(COCO 有 1000 张背景图片可供参考,占总数的 1%)。
网络选择
- YOLOv5x 和YOLOv5x6等较大的模型几乎在所有情况下都会产生更好的结果,但参数更多,需要更多的 CUDA 内存来训练,并且运行速度较慢。s/m适合移动端部署,l/x适合云端部署。
- 中小型数据集(即 VOC、VisDrone、GlobalWheat)可以使用预训练权重开始训练。
- 大型数据集(即 COCO、Objects365、OIv6)可以不使用与训练权重。
训练设置
在修改任何内容之

最低0.47元/天 解锁文章
632





