YOLO数据集划分

最新推荐文章于 2025-11-19 21:55:39 发布

原创

最新推荐文章于 2025-11-19 21:55:39 发布 · 2.1k 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#pytorch #深度学习 #1024程序员节

这段代码用于将YOLO数据集按照指定的比例划分为训练集和验证集，并分别保存图像和对应的标签文件。通过随机种子确保每次划分一致，设置训练集比例为0.9，最终打印出图片总数、训练集数量和验证集数量。

import os
import cv2
import random
from PIL import Image
# os.makedirs('labels_train')
# os.makedirs('labels_val')

img_train_path ='.//images/train/' #图片训练集保存路径，需要自己新建
img_val_path = './/images/val/' #图片验证集保存路径需要自己新建
labels_train_path = './custom/labels/train/' #标签训练集保存路径需要自己新建
labels_val_path = './custom/labels/val/' #标签验证集保存路径需要自己新建
dir_images = './img/' #数据集路径
dir_labels = './ann/' #标签路径

images = os.listdir(dir_images) #把所有的图片名放入一个列表中
labels = os.listdir(dir_labels) #labels的顺序和images的顺序不一定是一致的

random.seed(2021)