VOC格式数据集ImageSets/Main文件夹内4个txt生成代码

最新推荐文章于 2023-08-07 13:30:14 发布

ccc_irene

最新推荐文章于 2023-08-07 13:30:14 发布

阅读量2.4k

点赞数

分类专栏：机器学习

本文链接：https://blog.youkuaiyun.com/qq_41433316/article/details/100045819

版权

机器学习专栏收录该内容

10 篇文章

订阅专栏

本文介绍了一个用于VOC数据集划分的Python脚本，该脚本将数据集划分为训练集、验证集和测试集，适用于目标检测任务的数据准备。通过随机采样方式，确保了数据集划分的均衡性和代表性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

import os
import random
 
trainval_percent = 0.8
train_percent = 0.85
xmlfilepath = '/home/cxm-irene/People-Date/VOC_person/Annotations'
txtsavepath = '/home/cxm-irene/People-Date/VOC_person/ImageSets/Main'
total_xml = os.listdir(xmlfilepath)
 
num=len(total_xml)
list=range(num)
tv=int(num*trainval_percent)
tr=int(tv*train_percent)
trainval= random.sample(list,tv)
train=random.sample(trainval,tr)
 
ftrainval = open(txtsavepath+'/trainval.txt', 'w')
ftest = open(txtsavepath+'/test.txt', 'w')
ftrain = open(txtsavepath+'/train.txt', 'w')
fval = open(txtsavepath+'/val.txt', 'w')
 
for i  in list:
    name=total_xml[i][:-4]+'\n'
    if i in trainval:
        ftrainval.write(name)
        if i in train:
            ftrain.write(name)
        else:
            fval.write(name)
    else:
        ftest.write(name)
 
ftrainval.close()
ftrain.close()
fval.close()
ftest .close()