YOLOv5数据集准备——xml格式标签转txt,自动划分训练集和验证集的python脚本

一. 标签文件格式转换

因为使用labelImg标注数据集默认的输出格式是xml,而YOLOv5需要的标签格式一般是txt,所以需要进入格式转换,下面代码实测有效:

import xml.etree.ElementTree as ET

import pickle
import os
from os import listdir, getcwd
from os.path import join
import glob

classes = ["person"]

def convert(size, box):
    dw = 1.0 / size[0]
    dh = 1.0 / size[1]
    x = (box[0] + box[1]) / 2.0
    y = (box[2] + box[3]) / 2.0
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x * dw
    w = w * dw
    y = y * dh
    h = h * dh
    return (x, y, w, h)

# 注意如果是在windows系统下那么路径里的反斜杠\应该多写一个,否则会和python的‘\’产生语义冲突
def convert_annotation(image_name):
    in_file = open('D:\\Users\\labels\\' + image_name[:-3] + 'xml')  # xml文件路径
    out_file = open('D:\\Users\\labels_txt\\' + image_name[:-3] + 'txt', 'w')  # 转换后的txt文件存放路径
    f = in_file
    xml_text = f.read()
    root = ET.fromstring(xml_text)
    f.close()
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)

    for obj in root.iter('object'):
        cls = obj.find('name').text
        if cls not in classes:
            print(cls)
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),
             float(xmlbox.find('ymax').text))
        bb = convert((w, h), b)
        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')


wd = getcwd()

if __name__ == '__main__':

    filenames = os.listdir('D:\\Users\\labels\\')# xml文件路径,这样输出的txt文件和xml一一对应

    for label_path in filenames:
        
        print(label_path)
        convert_annotation(label_path)

二.自动划分训练集和验证集

主要需要注意的是,因为有些图片没有标签,所以图片和标签不是一一匹配的,因此需要在标签划分时产生路径找不到的异常时,直接跳过(pass)

import os
import random
import shutil
 
 
 
 
def moveFile(input1,input2,save1,save2):
    pathDir = os.listdir(input1)  # 取图片的原始路径
    random.seed(1) # 设置随机种子
    filenumber = len(pathDir)  # 原文件个数
    rate = 0.1  # 设置抽取的验证集的比例
    picknumber = int(filenumber * rate)  # 按照rate比例从文件夹中取图片
    sample = random.sample(pathDir, picknumber)  # 随机选取需要数量的样本图片
    print(sample)
    list_len=len(sample) 
    print(list_len)
    list=[]
    for i in range(len(sample)):
        list.append(sample[i].split('.')[0])
    print(list)
    for flie_name in list:
        path_img=os.path.join(input1,flie_name+'.png')
        shutil.move(path_img,save1)
        try:
            path_lab=os.path.join(input2,flie_name+'.txt')
            shutil.move(path_lab,save2)
        except:       # 异常捕获,然后跳过
            pass
            continue
        

if __name__ == '__main__':
    input_path1='.\\images\\'
    input_path2= '.\\labels\\'
    save_img='.\\val\\images\\'
    save_lab='.\\val\\labels\\'
    if not os.path.exists(save_lab):
        os.makedirs(save_lab)
    if not os.path.exists(save_img):
        os.makedirs(save_img)
    moveFile(input_path1,input_path2,save_img,save_lab)```


### YOLOv5 数据集格式要求 对于YOLOv5模型而言,其数据集有着特定的文件结构与标签格式需求。具体来说,在准备用于YOLOv5训练的数据集时,图像文件通常保存为`.jpg`或其他常见图片格式,而对应的标注信息则需换成YOLO格式并存储于同名但扩展名为`.txt`的文件中[^1]。 #### 文件结构 典型的YOLOv5项目目录下会存在如下几个重要子目录: - `images/`: 存放所有的输入图像; - `labels/`: 放置对应每张图标的边界框位置描述文本文件; 这两个主要文件夹内部还需进一步划分训练集(`train`)、验证集(`val`)以及可选测试集(`test`)三个部分,以便支持不同阶段的学习评估工作。 #### 标签文件格式 每一个位于`labels/{split}/`中的`.txt`文档都应遵循严格的书写标准来表示目标物体的位置坐标。每一行代表单个实例的信息,由五个数值构成——即类别ID加上四个相对坐标的浮点数(中心点横纵比例x_center, y_center及宽度高度宽高比w,h),这些值均被限定在0到1之间以适应各种尺寸的画面范围。 例如,假设有一张分辨率为480×640像素的照片内含有两个待识别对象,则相应的TXT记录可能是这样的形式: ``` 0 0.716797 0.395833 0.240741 0.666667 1 0.552778 0.500000 0.177778 0.277778 ``` 这里的第一列指定了所属类别的索引号,后续四列为标准化后的矩形区域参数。 为了将现有的VOC格式XML化为上述所需的YOLO样式,可以编写简单的脚本完成批量处理任务。Python编程语言提供了丰富的库函数能够简化此过程,比如利用xml.etree.ElementTree解析源文件,并通过os模块操作路径名称等[^2]。 ```python import xml.etree.ElementTree as ET from pathlib import Path def convert_voc_to_yolo(xml_file: str, output_dir: str): tree = ET.parse(xml_file) root = tree.getroot() size = root.find('size') w = int(size.find('width').text) h = int(size.find('height').text) with open(Path(output_dir) / f"{Path(xml_file).stem}.txt", "w") as out_f: for obj in root.iter('object'): difficult = obj.find('difficult').text cls_name = obj.find('name').text # 假设有一个字典映射类别名字到整数编号 class_ids = {'cat': 0, 'dog': 1} if int(difficult)==1: continue xmlbox = obj.find('bndbox') b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text), float(xmlbox.find('ymax').text)) bb = convert_bbox((w,h), b) out_f.write(f"{class_ids[cls_name]} {bb[0]:.6f} {bb[1]:.6f} {bb[2]:.6f} {bb[3]:.6f}\n") def convert_bbox(size, box): dw = 1./size[0] dh = 1./size[1] x = (box[0] + box[1])/2.0 y = (box[2] + box[3])/2.0 w = box[1] - box[0] h = box[3] - box[2] x = x*dw w = w*dw y = y*dh h = h*dh return (x,y,w,h) # 使用示例 convert_voc_to_yolo("path/to/xml/file.xml", "output/directory/") ``` 这段代码展示了如何读取给定的Pascal VOC XML文件并将其中的对象信息按照YOLO v5的要求写入新的文本文件中去。注意这里的类别编码需要依据实际应用场景自行定义调整。
评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值