生成数据集train/val/test.txt文件列表(前提是train/val/test数据图片是已经分好的)
import numpy as np
import os
base = './dataset/road/'
with open('dataset/road/labels.txt', 'w') as f:
for i in range(20):
f.write(str(i)+'\n')
imgs = os.listdir(base+'train_pic/')
np.random.seed(42)
np.random.shuffle(imgs)
val_num = int(0.1 * len(imgs))
with open(os.path.join('dataset/road/train_list.txt'), 'w') as f:
for pt in imgs[:-val_num]:
img = 'train_pic/'+pt
ann = 'train_tag/'+pt.replace('.jpg', '.png'

本文介绍了一种生成图像标注数据集的方法,包括训练、验证及测试数据的划分过程。通过随机打乱图片列表并按比例分配到各集合中,确保了数据分布的一致性。
最低0.47元/天 解锁文章
4257

被折叠的 条评论
为什么被折叠?



