作者有话说:我是个小白,这个是我的学习记录,以便以后回过头来看的时候能看懂;-),希望也可以帮助到大家🤗别杠杠就是你对哈哈哈哈哈哈
目录
一、VOC标签格式转成yolo格式,同时进行训练集和验证集的划分
一、VOC标签格式转成yolo格式,同时进行训练集和验证集的划分
1.我们前面那章所做的标签是VOC格式的,也就是.xml,而yolov5训练需要的文件格式是yolo的,也就是.txt的,这里就需要将xml格式的标签文件转换为txt文件的。
2. 先打开pycharm,打开一个工程,然后将之前打好标签的那个文件(VOCdevkit)复制到工程里去,这个文件的格式必须严格按照下图所示,因为下面那个代码文件名就是这个,如果要改的话,会很麻烦(所以小白的我选择严格按照来~)。
3.下面提供的代码是将xml格式的文件转换为txt格式的文件,同时也在训练自己的yolov5检测模型时,将数据集需要划分为训练集和验证集。
import xml.etree.ElementTree as ET
import pickle
import os
from os import listdir, getcwd
from os.path import join
import random
from shutil import copyfile
classes = ["hat", "person"]
#classes=["ball"]
TRAIN_RATIO = 80
def clear_hidden_files(path):
dir_list = os.listdir(path)
for i in dir_list:
abspath = os.path.join(os.path.abspath(path), i)
if os.path.isfile(abspath):
if i.startswith("._"):
os.remove(abspath)
else:
clear_hidden_files(abspath)
def convert(size, box):
dw = 1./size[0]
dh = 1./size[1]
x = (box[0] + box[1])/2.0
y = (box[2] + box[3])/2.0
w = box[1] - box[0]