LabelImg 标注的xml文件转成yolo下的txt格式。

这篇博客介绍了一个Python脚本,用于将目标检测数据集中的XML标注文件转换为适用于YOLOv3的TXT格式。脚本首先定义了类别名称,然后遍历指定目录下的所有XML文件,解析每个文件中的边界框信息,并将这些信息归一化到0-1范围内,以符合YOLOv3的标签要求。转换过程中,如果遇到宽度为0的问题,脚本会打印出错误信息。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

故事背景

在做目标检测时,标注数据集往往使用labelimg,但一般情况下生成的是xml格式的文件。xml转txt

代码

import os
import os.path
import xml.etree.ElementTree as ET
import glob

class_names = ['good','bad']  # 类别名,依次写下来
dirpath = r'./data'  # 原来存放xml文件的目录
newdir = r'./output'  # 修改label后形成的txt目录

if not os.path.exists(newdir):
    os.makedirs(newdir)

for fp in os.listdir(dirpath):

    root = ET.parse(os.path.join(dirpath, fp)).getroot()

    xmin, ymin, xmax, ymax = 0, 0, 0, 0
    sz = root.find('size')
    width = float(sz[0].text)
    height = float(sz[1].text)
    filename = root.find('filename').text
    for child in root.findall('object'):  # 找到图片中的所有框
        name = child.find('name').text  # 找到类别名
        class_num = class_names.index(name)  #

        sub = child.find('bndbox')  # 找到框的标注值并进行读取
        xmin = float(sub[0].text)
        ymin = float(sub[1].text)
        xmax = float(sub[2].text)
        ymax = float(sub[3].text)
        try:  # 转换成yolov3的标签格式,需要归一化到(0-1)的范围内
            x_center = (xmin + xmax) / (2 * width)
            y_center = (ymin + ymax) / (2 * height)
            w = (xmax - xmin) / width
            h = (ymax - ymin) / height
        except ZeroDivisionError:
            print(filename, '的 width有问题')

        with open(os.path.join(newdir, fp.split('.')[0] + '.txt'), 'a+') as f:
            f.write(' '.join([str(class_num), str(x_center), str(y_center), str(w), str(h) + '\n']))




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值