修改 xml 格式的训练数据标注集（label / annotation）的 python 脚本

最新推荐文章于 2023-09-22 16:50:23 发布

原创

最新推荐文章于 2023-09-22 16:50:23 发布 · 879 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#xml #python #深度学习 label

在R-FCN训练中遇到由于XML标注文件起点坐标为(0,0)导致的numpy运行时错误。通过fool-zz的博客找到问题根源后，编写了一个利用xml.etree模块的Python脚本，批量修正XML标注文件，避免LOSS出现Nan问题，提高标注修改效率。" 133606957,20015923,Oracle数据库内存优化：SGA与PGA的配置策略,"['Oracle数据库', '数据库优化', '内存管理']

最近遇到了 R-FCN 训练时，numpy 会报错的情况，错误如下：

RuntimeWarning: invalid value encountered in log targets_dw = np.log(gt_widths / ex_widths)

搞得 LOSS 一直是 Nan，很是头疼。
几经查询，看到了fool-zz 的博客，将问题确定在了标注上。查阅自己的 xml 标注文件（ labelImage 生成），发现确实有的框的起点在图片的左上角，也就是 (0,0)，引发了上述错误。

手动修改 xml 实在是太辛苦了，所以写了个 python 脚本，利用 xml.etree 进行修改，方便快捷。并且日后修改标注（xml格式）时简单修改就可以拿来使用，非常方便。

最后附上代码：

import os
import xml.etree.ElementTree as ET

path = './Annotations_needRectify'

for xml in os.listdir<

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Lawliet_xh

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

训练集制作--利用Python进行图像和XML标注数据的批量处理

い天然呆的博客

04-12

1076

在机器学习项目中，特别是涉及到图像识别和分类的领域，经常需要对大量数据进行预处理。这些数据预处理可能包括图像转换、格式化标签、数据集划分等。本文将介绍一个基于Python的脚本，该脚本能够自动化这些常见任务，并且还支持多进程处理以加速这些操作。

YOLOv5数据集准备——xml格式标签转txt，自动划分训练集和验证集的python脚本

mrqiuwen的博客

11-23

3293

提供了关于YOLO目标检测数据集处理的两份代码，一份关于标签文件的转换，xml 转换成txt，一份关于训练集和验证集的划分

参与评论您还未登录，请先登录后发表或查看评论

Yolov3训练自己标记的数据

Blackrosetian的博客

12-13

3288

一、首先下载配置Yolov3框架 git clone https://github.com/pjreddie/darknet cd darknet make 下载常用的模型文件 wget https://pjreddie.com/media/files/yolov3.weights wget https://pjreddie.com/media/files/yolov3-tiny.wei...

ssd训练的annotation文件格式

shutongliu的博客

04-18

619

<annotation> <folder>JPEGImages</folder> <filename>barcode_0001</filename> //统一编号 <path>C:\Users\pstech\Desktop\result\JPEGImages\barcode_0001.jpg</...

深度学习python之制作VOC数据集中的xml文件（Annotations文件夹内）

恰同学少年的博客

12-20

8327

深度学习python之制作VOC数据集中的xml文件（Annotations文件夹内）from lxml.etree import Element, SubElement, tostring from xml.dom.minidom import parseStringdef make_xml(xmin_tuple, ymin_tuple, xmax_tuple, ymax_tuple, image

将voc数据集的几个label合并成一个，并将xml格式的annotation转换成txt文件

limtyty的博客

04-21

1007

在调试《Few-shot Object Detection via Feature Reweighting》一文代码过程中，遇到了label合并cmd命令不正确的问题，故修改voc_lable_1c,py文件这里参考了网上的cat命令介绍：https://www.geeksforgeeks.org/cat-command-in-linux-with-examples/ 以及type的命令介绍：https://blog.youkuaiyun.com/LL845876425/article/details/7003.

txt2xml.py文件

KyrieHe的博客

09-03

930

from xml.dom import minidom import cv2 import os path = '/home/hy/work/OCR_Detection_Simple/data/label' setname = set([i.split('.')[0] for i in os.listdir(path)]) for i in setname: txt_dirtory = ...

coco2017数据集--训练集的xml标注文件

09-11

此文件是使用coco2017的训练集的原json标注格式转化为xml文件标注格式的所有图片的标注，共118287个xml文件

使用labelimg进行图像标注，获得yolov所需数据集/xml标注文件转yolov5txt 脚本

yezlin的博客

11-08

1396

pip install -i 镜像源包名，例如： pip install -i https://mirrors.aliyun.com/pypi/simple labelImg。注意保存格式从PascalVOC切换为YOLO后，只会将接下来标注的图保存为YOLO格式，已经保存为PascalVOC修改的图是不会自动切换为YOLO格式的。例如：pip config set global.index-url https://mirrors.aliyun.com/pypi/simple。

将TXT文本标注label转换为VOC格式XML文件

08-12

将TXT文本标注label转换为VOC格式XML文件是一项基础但重要的工作，它为后续的模型训练和评估提供了必要的数据支持。这个过程需要对Pascal VOC格式有清晰的理解，并且具备一定的Python编程能力。对于涉及大量数据的...

标记xml转换成yolo所需的label

02-01

yolo训练所需的标注文件，xml需要转化成label。这个python文件可以实现这个功能。如有疑问请留言，欢迎指正。

YOLO删除label中txt为空的，对应的图片和XML文件

weixin_57790393的博客

10-16

1023

主要针对公共数据集，如果你想找出其中一部分的类别而不是全部进行训练，可以用这个代码，首先生成label标签，后面可以用这个进行剔除，没有你想训练的类的图片和xml文件

yolov5数据构建的两种方式

weixin_45493537的博客

09-22

499

对于还不太熟悉yolov5源代码的同学，利用自己的数据集构建符合yolov5训练格式的数据集应该挺让人头大的，所以下面我来讲一下构建训练数据的两种常用方式：一般标注的标签格式为xml文件格式，我们首先需要将xml格式转成txt格式文件。通过以上代码就可以获取labels文件夹，里面是每张图片的GT框信息。还有images文件夹，里面是对应的图像文件。

【COCO数据集】Annotations标注解析

最新发布

11-13

<think> 我们有一个任务：使用Python脚本修改.xml标注文件中的缺陷类型（即对象类别名称）。这些.xml文件可能是由LabelImg等工具生成的标注文件。根据引用内容，我们可以看到一些相关的操作，比如修改xml文件中的内容（如path标签）或生成自定义的xml文件。在引用[3]中，示例代码展示了如何通过ElementTree解析xml文件，然后查找并修改特定元素（如'path'元素），最后写回文件。具体到我们的需求：修改缺陷类型（即对象类别名称）。假设在xml文件中，每个对象（object）都有一个类别名称（name）元素。例如，一个典型的标注文件可能包含如下结构： <annotation> <object> <name>defect_type1</name> ... </object> ... 可能还有多个object </annotation> 我们需要做的是： 1. 遍历所有xml文件（或指定的xml文件）。 2. 解析每个xml文件。 3. 找到所有的object元素，然后修改其中的name元素的内容（将旧的缺陷类型名改为新的）。步骤： 1. 导入ElementTree模块（通常使用xml.etree.ElementTree）。 2. 遍历每个xml文件（这里假设我们有一个文件列表，可以通过glob模块获取）。 3. 解析xml文件。 4. 获取根节点。 5. 使用findall或iter查找所有的object元素。 6. 对于每个object元素，找到其下的name元素，并修改其文本（text）为新的缺陷类型。 7. 将修改后的树写回到原文件（或新文件）。注意：在写回文件时，要注意保留原文件的格式。ElementTree在写回时可能不会保留原格式（如缩进），因此可能需要使用minidom进行美化。但是，引用[3]中使用了ElementTree的write方法，没有进行美化。如果需要美化，可以参考以下步骤： - 使用ElementTree解析后，用minidom解析字符串并美化。 - 或者，使用lxml库（它可以保留格式，但需要安装）。由于用户没有特别要求保留格式，我们可以先使用ElementTree，如果格式混乱再考虑用minidom美化。另外，我们需要知道旧缺陷类型名和新缺陷类型名的映射关系。这里假设我们有一个映射字典，例如： mapping = { "old_defect1": "new_defect1", "old_defect2": "new_defect2", ... } 这样，在修改时，我们检查name元素的文本是否在映射字典的键中，如果在，就替换为对应的新名称。代码结构： 1. 定义映射字典。 2. 获取所有xml文件的路径（可以使用glob.glob匹配）。 3. 遍历每个xml文件。 4. 解析xml文件。 5. 获取根节点。 6. 遍历所有的object元素（注意：xml中可能有多个object）。 7. 对于每个object，找到其下的name元素（使用find方法）。 8. 获取当前name的文本，检查是否在映射字典中，如果在，则替换。 9. 写回文件（覆盖原文件或另存为新文件）。注意：如果原文件需要备份，建议先备份。下面是一个示例代码： ```python import os import xml.etree.ElementTree as ET # 定义旧缺陷类型到新缺陷类型的映射 mapping = { "crack": "crack_v1", # 将裂缝改为crack_v1 "scratch": "scratch_v1" # 将划痕改为scratch_v1 # 根据实际情况添加更多 } # 包含xml文件的文件夹路径 xml_dir = "/path/to/xml/files" # 遍历文件夹中的所有xml文件 for xml_file in os.listdir(xml_dir): if not xml_file.endswith('.xml'): continue full_path = os.path.join(xml_dir, xml_file) # 解析xml文件 tree = ET.parse(full_path) root = tree.getroot() # 查找所有的object元素 for obj in root.findall('object'): # 在object元素下查找name元素 name_elem = obj.find('name') if name_elem is not None: current_name = name_elem.text # 如果当前名称在映射字典中，则进行替换 if current_name in mapping: new_name = mapping[current_name] name_elem.text = new_name # 写回原文件（覆盖） tree.write(full_path, encoding='utf-8') # 如果需要美化，可以转换为minidom重新写，但这样会丢失注释（如果有的话） # 下面是用minidom美化的步骤（可选） # from xml.dom import minidom # rough_string = ET.tostring(root, 'utf-8') # reparsed = minidom.parseString(rough_string) # with open(full_path, 'w', encoding='utf-8') as f: # reparsed.writexml(f, indent='\t', addindent='\t', newl='\n', encoding='utf-8') print("修改完成！") ``` 注意：如果xml文件中有注释，上述代码使用minidom可能会丢失注释。如果没有注释，并且希望格式美观，可以使用注释掉的那段代码代替tree.write。另外，如果xml文件结构不同（比如有命名空间），那么查找元素的方式需要调整。但LabelImg生成的xml通常没有命名空间。根据引用[3]中的方法，我们使用find和findall来查找元素，这些方法在ElementTree中用于在当前元素的直接子元素中查找。如果object元素不在根元素的直接子元素下（比如在多层嵌套中），那么可能需要使用更通用的方法，比如使用root.iter('object')来递归查找所有object元素。但LabelImg生成的xml中，object是annotation的直接子元素，所以使用root.findall('object')即可。如果用户有特殊结构，需要调整。因此，上述代码应该可以满足需求。如果用户需要修改多个文件夹，或者需要更复杂的映射，可以扩展这个脚本。另外，引用[2]提到了使用lxml库，它更强大，但需要安装。如果用户已经安装了lxml，也可以使用lxml.etree，它在处理大型文件时可能更快，并且可以更好地保留格式（如缩进）。不过，标准库的ElementTree通常足够。如果用户需要保留原格式（缩进和换行），并且不想用minidom（因为minidom会改变格式），可以考虑使用lxml。但是，由于标准库中已经包含ElementTree，我们优先使用它。如果用户对格式要求很高，且原文件格式很重要，可以考虑使用lxml。这里不展开。因此，我们提供上述代码作为解决方案。如果用户需要，也可以将修改后的文件写入新目录，而不是覆盖原文件。这可以通过改变输出路径实现。例如，创建一个新的目录“modified_xml”，然后将修改后的xml文件写入这个目录。代码修改如下（可选）： ```python import os import xml.etree.ElementTree as ET mapping = { "crack": "crack_v1", "scratch": "scratch_v1" } xml_dir = "/path/to/xml/files" output_dir = "/path/to/modified_xml" os.makedirs(output_dir, exist_ok=True) # 确保输出目录存在 for xml_file in os.listdir(xml_dir): if not xml_file.endswith('.xml'): continue full_path = os.path.join(xml_dir, xml_file) tree = ET.parse(full_path) root = tree.getroot() for obj in root.findall('object'): name_elem = obj.find('name') if name_elem is not None and name_elem.text in mapping: name_elem.text = mapping[name_elem.text] # 写入输出目录 output_path = os.path.join(output_dir, xml_file) tree.write(output_path, encoding='utf-8') print("修改完成，文件保存在：", output_dir) ``` 这样就不会覆盖原文件。综上所述，我们提供了两种方式：覆盖原文件和另存为新文件。请用户根据实际需求选择。注意：在运行脚本前，请备份原文件，以防万一。 </think> ### Python脚本修改XML标注文件中缺陷类型的方法要使用Python脚本修改XML标注文件中的缺陷类型（对象类别名称），可以通过以下步骤实现： #### 核心方法（使用xml.etree.ElementTree） ```python import xml.etree.ElementTree as ET import os def modify_defect_type(xml_path, old_name, new_name): """修改XML文件中特定缺陷类型的标签名称""" tree = ET.parse(xml_path) root = tree.getroot() # 遍历所有object节点 for obj in root.findall('object'): name_elem = obj.find('name') if name_elem is not None and name_elem.text == old_name: name_elem.text = new_name # 替换缺陷类型名称 # 保持原格式写入（使用minidom美化输出） raw_str = ET.tostring(root, encoding='utf-8') from xml.dom import minidom parsed = minidom.parseString(raw_str) with open(xml_path, 'w', encoding='utf-8') as f: parsed.writexml(f, indent='\t', addindent='\t', newl='\n', encoding='utf-8') # 批量处理示例 xml_dir = "/path/to/xml_files" old_defect = "crack" # 原缺陷类型名称 new_defect = "fracture" # 新缺陷类型名称 for xml_file in os.listdir(xml_dir): if xml_file.endswith('.xml'): modify_defect_type(os.path.join(xml_dir, xml_file), old_defect, new_defect) ``` #### 关键步骤说明： 1. **XML解析**： - 使用`ET.parse()`加载XML文件 - 获取根节点`root = tree.getroot()` 2. **定位缺陷节点**： - 通过`root.findall('object')`获取所有缺陷对象 - 使用`obj.find('name')`定位类别名称节点 3. **名称替换**： - 检查当前名称是否匹配目标缺陷类型：`if name_elem.text == old_name` - 修改文本内容：`name_elem.text = new_name` 4. **格式保持**： - 使用`minidom.parseString`保持原XML缩进格式 - 通过`writexml()`参数保留文件结构 #### 高级应用场景 1. **多类别批量替换**（使用映射字典）： ```python type_mapping = { "scratch": "surface_damage", "rust": "corrosion", "dent": "deformation" } for obj in root.findall('object'): name_elem = obj.find('name') if name_elem.text in type_mapping: name_elem.text = type_mapping[name_elem.text] ``` 2. **条件过滤修改**（仅修改特定尺寸的缺陷）： ```python for obj in root.findall('object'): name_elem = obj.find('name') bndbox = obj.find('bndbox') # 计算缺陷面积 xmin = int(bndbox.find('xmin').text) ymin = int(bndbox.find('ymin').text) area = (int(bndbox.find('xmax').text) - xmin) * (int(bndbox.find('ymax').text) - ymin) # 小面积裂纹重分类 if name_elem.text == "crack" and area < 100: name_elem.text = "micro_crack" ``` #### 注意事项 1. **文件备份**： ```python import shutil shutil.copy(xml_path, xml_path + ".bak") # 修改前创建备份 ``` 2. **异常处理**： ```python try: tree = ET.parse(xml_path) except ET.ParseError: print(f"损坏文件跳过: {xml_path}") ``` 3. **命名空间处理**（若存在）： ```python ET.register_namespace('', "http://example.com/ns") # 注册命名空间 ``` [^1]: 实现基于ElementTree的XML解析和修改方法 [^2]: 采用minidom保持原文件格式 [^3]: 通过条件过滤实现智能重分类