.XML格式转.TXT格式
只需要修改代码前面,xml文件目录、转换后的txt文件目录,以及数据集类别名称三个地方
import os
import xml.etree.ElementTree as ET
# xml文件存放目录(不要以\结尾)
input_dir = r'H:/Data/cotton-pest/dataAugment/Annotations'
# 输出txt文件目录(不要以\结尾)
out_dir = r'H:/Data/cotton-pest/dataAugment/YOLOlabels'
#类别名
class_list = ["lacewing","ladybug_dy","ladybug_lbq"]
# 获取目录所有xml文件
def file_name(input_dir):
F = []
for root, dirs, files in os.walk(input_dir):
for file in files:
# print file.decode('gbk') #文件名中有中文字符时转码
if os.path.splitext(file)[1] == '.xml':
t = os.path.splitext(file)[0]
F.append(t) # 将所有的文件名添加到L列表中
return F # 返回L列表
# 获取所有分类
def get_class(filelist):
for i in filelist:
f_dir = input_dir + "\\" + i + ".xml"
in_file &