标注工具生成的xml文件转为txt格式

最新推荐文章于 2025-09-25 14:28:16 发布

原创最新推荐文章于 2025-09-25 14:28:16 发布 · 1.8w 阅读

70 ·

CC 4.0 BY-SA版权

Deep learning 专栏收录该内容

45 篇文章

订阅专栏

本文介绍了一种将LabelImg生成的XML格式标注文件转换为坐标加标签TXT格式的方法，适用于多数网络训练的需求。通过解析XML文件获取标注框坐标，并将其写入TXT文件中。

上一篇文章介绍学习了标注工具labelImg的安装及详细使用，可以看到其标注成功之后生成的为xml格式文件：
这里写图片描述

但是大多数网络训练的时候需要对其进行格式转换，转为：坐标+标签的txt格式类型的，所以如下程序用于实现此功能：

import os
import sys
import xml.etree.ElementTree as ET
import glob

def xml_to_txt(indir,outdir):

    os.chdir(indir)
    annotations = os.listdir('.')
    annotations = glob.glob(str(annotations)+'*.xml')

    for i, file in enumerate(annotations):

        file_save = file.split('.')[0]+'.txt'
        file_txt=os.path.join(outdir,file_save)
        f_w = open(file_txt,'w')

        # actual parsing
        in_file = open(file)
        tree=ET.parse(in_file)
        root = tree.getroot()

        for obj in root.iter('object'):
                current = list()
                name = obj.find('name').text

                xmlbox = obj.find('bndbox')
                xn = xmlbox.find('xmin').text
                xx = xmlbox.find('xmax').text
                yn = xmlbox.find('ymin').text
                yx = xmlbox.find('ymax').text
                #print xn
                f_w.write(xn+' '+yn+' '+xx+' '+yx+' ')
                f_w.write(name.encode("utf-8")+'\n')

indir='/home/zgz/data-xml'   #xml目录
outdir='/home/zgz/data-txt'  #txt目录

xml_to_txt(indir,outdir)

转换之后形式如下：
这里写图片描述

注意上面的每一行：4个点表示标注矩形框的上下斜对角线的2个坐标值，及后面的为label；

14 条评论

一个默默无闻的小学生 2024.08.17
得到的txt没有归一化呀

城pr 2022.03.15
这个不太对吧，voc格式里的位置是相对位置

Jackchen Ruan 2020.01.31
创建出labels文件中的txt都是空的请问下这是什么情况？

Jackchen Ruan 2020.01.31
创建出labels文件中的txt都是空的请问下这是什么情况？

weixin_41157922 2019.11.26
请问运行输出can't concat str to bytes是什么情况？
- 哈哈哈lowKitty回复weixin_41157922 2020.06.15
  [reply]weixin_41157922[/reply]https://blog.youkuaiyun.com/shashaqingmuzi/article/details/80932689

王座上的囚徒 2019.01.16
优秀

weixin_39199687 2018.12.31
您好，您这是将一个xml文件里的数据转化成txt吗？有没有将所有的xml文件转化到一个txt里的啊？
- sw25871回复weixin_39199687 2019.03.24
  [reply]weixin_39199687[/reply]你好，请问你实现了吗？能不能指导一下？
- Enjoy_endless回复weixin_39199687 2019.01.02
  [reply]weixin_39199687[/reply] 你循环读取xml文件然后追加到同一个txt不就可以了吗？

可可儿子 2018.09.06
请教一下我想把多张图片的标签信息放到同一个txt文件中，应该如何改动呀。我对python处理文件方面不是很熟悉
- 万工博客回复可可儿子 2019.05.14
  [reply]qq_25079977[/reply] 你好，请问代码没有错误。但运行没有结果啊？
- 可可儿子回复Enjoy_endless 2018.09.07
  [reply]Enjoy_endless[/reply] 就你图中所列的这种格式吧
- Enjoy_endless回复可可儿子 2018.09.06
  [reply]qq_25079977[/reply] 你是想以什么样的格式放在一个txt里面呢？