制作私有VOC格式的数据集,如果出现标签标错的情况下,一个一个去修改就太浪费时间了,因此可以直接解析XML文件,找到要修改的标签,直接批量修改。
import os
import xml.etree.ElementTree as ET
#程序功能:批量修改VOC数据集中xml标签文件的标签名称
def changelabelname(inputpath):
listdir = os.listdir(inputpath)
count = 0
for file in listdir:
if file.endswith('xml'):
file = os.path.join(inputpath,file)
tree = ET.parse(file)
root = tree.getroot()
for object1 in root.findall('object'):
for sku in object1.findall('name'): #查找需要修改的名称
if sku.text == 'oil_linew': #修改前的名称
sku.text = 'oil_line' #修改后的名称
tree.write(file,encoding='utf-8') #写进原始的xml文件并避免原始xml中文字符乱码
count += 1
print("替换了%d次"%count)
else:
pass
else:
pass
if __name__ == '__main__':
inputpath = r'D:\BaiduNetdiskDownload\加油站0608\1' #此处替换为自己的路径
changelabelname(inputpath)