yolo格式的txt与labelimg的xml文件互转

原创已于 2023-03-15 21:57:15 修改 · 904 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习

于 2022-11-06 19:05:08 首次发布

deep learning 同时被 2 个专栏收录

148 篇文章

订阅专栏

detection

30 篇文章

订阅专栏

本文介绍了一种用于将YOLOv5格式的TXT标签文件转换为Pascal VOC XML格式，并能逆向转换的方法。该工具通过Python脚本实现，能够处理图像目录下的图片尺寸信息并将其写入XML文件中，同时也能从XML文件中读取目标框坐标信息并转换回TXT格式。

部署运行你感兴趣的模型镜像

txt2xml.py

import cv2
from pathlib import Path
from xml.dom.minidom import Document
 

img_dir = './dir/img/'              # 图片文件路径
txt_dir = './dir/txt/'              # txt文件路径
xml_dir = './dir/xml/'              # xml文件路径   
labels = {'0':'person', '1':'car'}  # 标签名

files = Path(txt_dir).glob('*txt')

for file in files:
    print(file)
    xmlBuilder = Document()
    annotation = xmlBuilder.createElement('annotation')  # 创建annotation标签
    xmlBuilder.appendChild(annotation)
    txtFile = open(file)
    txtList = txtFile.readlines()
    img = cv2.imread(img_dir + file.stem + '.jpg')
    h, w, d = img.shape

    filename = xmlBuilder.createElement('filename')  # filename标签
    filenamecontent = xmlBuilder.createTextNode(img_dir + file.stem + '.jpg')
    filename.appendChild(filenamecontent)
    annotation.appendChild(filename)  # filename标签结束

    size = xmlBuilder.createElement('size')  # size标签
    width = xmlBuilder.createElement('width')  # size子标签width
    widthcontent = xmlBuilder.createTextNode(str(w))
    width.appendChild(widthcontent)
    size.appendChild(width)  # size子标签width结束

    height = xmlBuilder.createElement('height')  # size子标签height
    heightcontent = xmlBuilder.createTextNode(str(h))
    height.appendChild(heightcontent)
    size.appendChild(height)  # size子标签height结束

    depth = xmlBuilder.createElement('depth')  # size子标签depth
    depthcontent = xmlBuilder.createTextNode(str(d))
    depth.appendChild(depthcontent)
    size.appendChild(depth)  # size子标签depth结束

    annotation.appendChild(size)  # size标签结束

    for line in txtList:
        oneline = line.strip().split(' ')
        object = xmlBuilder.createElement('object')  # object 标签
        picname = xmlBuilder.createElement('name')  # name标签
        namecontent = xmlBuilder.createTextNode(labels[oneline[0]])
        picname.appendChild(namecontent)
        object.appendChild(picname)  # name标签结束

        bndbox = xmlBuilder.createElement('bndbox')  # bndbox标签
        xmin = xmlBuilder.createElement('xmin')  # xmin标签
        mathData = int(((float(oneline[1])) * w) - (float(oneline[3])) * 0.5 * w)
        xminContent = xmlBuilder.createTextNode(str(mathData))
        xmin.appendChild(xminContent)
        bndbox.appendChild(xmin)  # xmin标签结束

        ymin = xmlBuilder.createElement('ymin')  # ymin标签
        mathData = int(((float(oneline[2])) * h) - (float(oneline[4])) * 0.5 * h)
        yminContent = xmlBuilder.createTextNode(str(mathData))
        ymin.appendChild(yminContent)
        bndbox.appendChild(ymin)  # ymin标签结束

        xmax = xmlBuilder.createElement('xmax')  # xmax标签
        mathData = int(((float(oneline[1])) * w) + (float(oneline[3])) * 0.5 * w)
        xmaxContent = xmlBuilder.createTextNode(str(mathData))
        xmax.appendChild(xmaxContent)
        bndbox.appendChild(xmax)  # xmax标签结束

        ymax = xmlBuilder.createElement('ymax')  # ymax标签
        mathData = int(((float(oneline[2])) * h) + (float(oneline[4])) * 0.5 * h)
        ymaxContent = xmlBuilder.createTextNode(str(mathData))
        ymax.appendChild(ymaxContent)
        bndbox.appendChild(ymax)  # ymax标签结束

        object.appendChild(bndbox)  # bndbox标签结束

        annotation.appendChild(object)  # object标签结束

    f = open(xml_dir + file.stem + '.xml', 'w')
    xmlBuilder.writexml(f, indent='\t', newl='\n', addindent='\t', encoding='utf-8')
    f.close()

xml2txt.py

from pathlib import Path
import xml.etree.ElementTree as ET

xml_dir = r'./dir/xml/'         # xml文件路径
txt_dir = r'./dir/txt/'         # txt文件路径
labels = {'0': "person", '1': "car"} # 标签名


def convert(box, dw, dh):
    x = (box[0] + box[2]) / 2.0
    y = (box[1] + box[3]) / 2.0
    w = box[2] - box[0]
    h = box[3] - box[1]

    x = x / dw
    y = y / dh
    w = w / dw
    h = h / dh

    return x,y,w,h


files = Path(xml_dir).glob('*xml')

for file in files:
    print(file)
    name = file.stem
    xml_o = open(xml_dir + '%s.xml'%name)
    txt_o = open(txt_dir + '%s.txt'%name,'w')

    pares = ET.parse(xml_o)
    root = pares.getroot()
    objects = root.findall('object')
    size = root.find('size')
    dw = int(size.find('width').text)
    dh = int(size.find('height').text)

    for obj in objects:
        cls = list(labels.values()).index(obj.find('name').text)
        bnd = obj.find('bndbox')
        b = (float(bnd.find('xmin').text),float(bnd.find('ymin').text), float(bnd.find('xmax').text),float(bnd.find('ymax').text))
        x,y,w,h = convert(b,dw,dh)
        write_t = '{} {:.5f} {:.5f} {:.5f} {:.5f}\n'.format(cls,x,y,w,h)
        txt_o.write(write_t)

    xml_o.close()
    txt_o.close()