Yolov8数据集 xml 文件转 txt 文件

本文介绍了如何将XML格式的数据转换为Yolo网络所需的txt格式,包括读取XML、解析尺寸和坐标信息、数据归一化并写入txt文件的过程,以及提供的Python代码示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

        Yolo网络的数据集是txt文本,当训练自己的模型时,如果网上找的数据都是xml格式,这时候我们需要对数据进行处理,得到我们想要的数据格式。

一、数据处理流程

        1.读取xml文件,解析xml 得到图片的宽,高,标定框的坐标信息
        2.数据归一化
        3.写入txt文件

二、xml文件数据格式

        如上图所示,是voc数据集中xml文件的数据,我们只需要得到object中的name信息,和size中的width,heightbndbox中的坐标信息。

三、代码

# 导入相关库
import os
from lxml import etree
from tqdm import tqdm


def voc2txt():
    # 获取xml文件夹下的所有xml文件名,存入列表
    xmls_list = os.listdir(xmls_ori_path)
    for xml_name in tqdm(xmls_list):
        # 打开写入文件
        txt_name = xml_name.replace('xml', 'txt')

        f = open(os.path.join(txts_save_path, txt_name), 'w')  # 代开待写入的txt文件
        with open(os.path.join(xmls_ori_path, xml_name), 'rb') as fp:
            # 开始解析xml文件
            xml = etree.HTML(fp.read())
            width = int(xml.xpath('//size/width/text()')[0])
            height = int(xml.xpath('//size/height/text()')[0])
            # 获取对象标签
            obj = xml.xpath('//object')
            for each in obj:
                name = each.xpath("./name/text()")[0]
                classes = dic[name]
                xmin = int(each.xpath('./bndbox/xmin/text()')[0])
                xmax = int(each.xpath('./bndbox/xmax/text()')[0])
                ymin = int(each.xpath('./bndbox/ymin/text()')[0])
                ymax = int(each.xpath('./bndbox/ymax/text()')[0])
                # 归一化
                dw = 1 / width
                dh = 1 / height
                x_center = (xmin + xmax) / 2
                y_center = (ymax + ymin) / 2
                w = (xmax - xmin)
                h = (ymax - ymin)
                x, y, w, h = x_center * dw, y_center * dh, w * dw, h * dh
                # 写入
                f.write(str(classes) + ' ' + str(x) + ' ' + str(y) + ' ' + str(w) + ' ' + str(h) + ' ' + '\n')
        f.close()  # 关闭txt文件


if __name__ == '__main__':
    dic = {'cardbord': "0",  # 创建字典用来对类型进行转换
           'glass': "1",     # 此处的字典要与自己的classes.txt文件中的类对应,且顺序要一致
           'metal': "2",
           'paper': "3",
           'plastic': "4",
           'trash': "5",
          }

    xmls_ori_path = r"/test"  # xml文件所在的文件夹
    txts_save_path = r"/txt"  # txt文件所在的文件夹

    os.mkdir(txts_save_path) if not os.path.exists(txts_save_path) else None

    voc2txt()

结论

        以上就是xml转txt文件的全部内容,在使用过程中出现什么问题,可以在评论区留言。

评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值