官方说明,下载自己的数据集
如何使用 YOLOv5 🚀 训练您自己的自定义数据集
- 在 Python>=3.8.0 环境中克隆存储库并安装requirements.txt,包括 PyTorch>=1.8。模型和数据集会从最新的 YOLOv5 版本自动下载。
- 创建自定义模型来检测对象是一个迭代过程,包括收集和组织图像、标记感兴趣的对象、训练模型、将其部署到野外进行预测,然后使用该部署的模型收集边缘案例的示例以进行重复和改进。
- YOLOv5 模型必须在标记数据上进行训练,以便学习该数据中的对象类。在开始训练之前,有两个选项可用于创建数据集:
选项 1:创建 Roboflow 数据集
1.1 收集图片。
您的模型将通过示例进行学习。对与野外看到的相似的图像进行训练至关重要。理想情况下,您将从相同的配置(相机、角度、照明等)收集各种图像,因为您最终将部署您的项目。 如果无法做到这一点,您可以从公共数据集开始训练初始模型,然后在推理过程中从野外采样图像,以迭代方式改进数据集和模型。
1.2 创建标签。
- 收集图像后,您需要对感兴趣的对象进行注释,以创建可供模型学习的基本事实。 Roboflow Annotate 是一个简单的基于 Web 的工具,用于与您的团队一起管理和标记您的图像,并以 YOLOv5 的注释格式导出它们。
1.3 为 YOLOv5 准备数据集。
- 无论您是否使用 Roboflow 标记图像,您都可以使用它将数据集转换为 YOLO 格式,创建 YOLOv5 YAML 配置文件,并将其托管以导入到您的训练脚本中。 创建一个免费的 Roboflow 帐户并将您的数据集上传到
Public
工作区,标记任何未注释的图像,然后以YOLOv5 Pytorch
格式生成和导出数据集的版本。 注意:YOLOv5 在训练期间会进行在线增强,因此我们不建议在 Roboflow 中使用 YOLOv5 进行任何增强步骤。但我们建议应用以下预处理步骤:- Auto-Orient - to strip EXIF orientation from your images.
自动定向 - 从图像中剥离 EXIF 方向。- Resize (Stretch) - to the square input size of your model (640x640 is the YOLOv5 default).
调整大小(拉伸) - 调整为模型的正方形输入大小(640x640 是 YOLOv5 的默认值)。生成版本将为您提供数据集的快照,因此您可以随时返回并比较未来的模型训练运行与它,即使稍后添加更多图像或更改其配置也是如此。 以YOLOv5 Pytorch
格式导出,然后将代码段复制到训练脚本或笔记本中以下载数据集。
选项 2:创建手动数据集
2.1:创建手动数据集。
COCO128 是一个示例小型教程数据集,由 COCO train2017 中的前 128 张图像组成。这些相同的 128 个图像用于训练和验证,以验证我们的训练管道是否能够过拟合。data/coco128.yaml,如下所示,是一个数据集配置文件,它定义了 1) 数据集根目录
path
和train
/val
/test
图像目录(或*.txt
具有图像路径的文件)的相对路径,以及 2) 类names
字典:
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..] path: ../datasets/coco128 # dataset root dir train: images/train2017 # train images (relative to 'path') 128 images val: images/train2017 # val images (relative to 'path') 128 images test: # test images (optional) # Classes (80 COCO classes) names: 0: person 1: bicycle 2: car # ... 77: teddy bear 78: hair drier 79: toothbrush
yolov5
最新推荐文章于 2025-03-30 22:40:55 发布