目标检测xml标签名修改

最新推荐文章于 2023-08-26 17:35:59 发布

原创

最新推荐文章于 2023-08-26 17:35:59 发布 · 456 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#xml #python #深度学习

博客指出目标检测的数据标注存在很多标签名标注错误的问题，需要进行修改，还提及了相关代码，但未给出具体内容。

原因

目标检测的数据标注中,很多标签名标注错误,需要修改

代码

import glob
import xml.etree.ElementTree as ET
from tqdm import tqdm

def change_xml(xml):
    doc = ET.parse(xml)
    root = doc.getroot(

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Cleansely

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

【目标检测txt2xml】label从YOLO格式txt文件转VOC格式xml文件

向上生长的程序媛的博客

02-10

204

YOLO格式txt转VOC格式xml，含Python代码

【目标检测xml2json】label从VOC格式xml文件转COCO格式json文件

向上生长的程序媛的博客

02-11

279

COCO整个训练集的标注都在一个文件内，json文件可以理解为键值对的格式，所以这边看最外层可以发现，整个标注其实由下面5个部分组成，每个部分又是新的键值对。json 文件的具体格式如下，整体是一个字典，字典里。COCO数据文件架构格式主要是按照训练样本集的类型来划分的，每个训练集下的架构一样。图片数据放在JPEGImages下，当前训练集所有的label数据。VOC数据格式是一种用于图像标注的标准格式，它用于存储图像及其相关的标注信息。在VOC格式中，每张图片的标注标签信息会被保存到一个XML文件中。

参与评论您还未登录，请先登录后发表或查看评论

【目标检测适用】批量修改xml文件中的name字段

pprp的博客

10-27

5155

前言：使用labelimg进行标注的时候，由于都是用的是默认的名称，有时候类的名字会出现拼写错误，比如我想要写的是“cow” 结果打上去的是“cwo”, 一出错就错一片，这很常见，所以参考了：https://www.jianshu.com/p/cf12bef0872c 的代码，修改了冗余的代码，并添加了新的模块以后，将代码分享给大家。文章目录1. xml文件展示2. 将文件夹中所有name进...

目标检测数据增强：更改xml的属性

winnerziqi的博客

03-07

345

更改xml的属性可以根据实际情况注释掉某些内容，比如folder、database等。 import os import os.path import xml.dom.minidom path="./Annotations_new"#生成新xml的路径 path_xml = r'D:\code\data\Annotations'#输入的xml路径 path_img=r'D:\code\data\JPEGImages'#输入的图片路径 files = os.listdir(path_xml) # 得到文

【目标检测实用脚本系列】修改图片和xml的文件名和属性值

weixin_45921929的博客

03-25

524

【目标检测实用脚本系列】修改图片和xml的文件名和属性值

目标检测：对文件夹内的图片进行重命名与删除xml文件的某个节点的内容。

weixin_42081390的博客

05-08

455

对文件夹内的图片进行重命名 # -*- coding:utf8 -*- import os class BatchRename(): ''' 批量重命名文件夹中的图片文件 ''' def __init__(self): self.path = '' #需要命名处理的文件夹 def rename(self): filelis...

根据xml中标签数据修改文件名

TN20000的博客

07-22

476

在制作数据集打标的时候忘记将原图片文件更改文件名就分开了，后不得不根据xml中的标签的数据往回找原图片来修改名字 import xml.dom.minidom import os #将文件夹内xml中对应的图片编号存储下来 fileList = os.listdir(r"E:/data_set/output/scratch") path1="E:/data_set/output/scratch" path2="E:/data_set/test2" fileList2 = os.listdir("E:/da

目标检测中多个xml标签合并

TEDDY的博客

03-12

1802

应用背景： pascal_voc格式数据集采用的是xml超文本标记语义记录监督信息的。但是大型数据集的制作非一人之力可及。多人合作可能会涉及到针对同一张图片的不同xml标签合并。适应： 目标检测中同一张图的多个xml标签，按照要求合并到一起，非直接拼接合并。这里一个特点是，不管要把多少个文件夹里的xml合并，只需要把这些文件夹统一放到一个列表dir里面就可以。然后实际上还是根据每一...

（19）目标检测算法之模型预测并保存结果到xml中，自动生成标签文件/自动标注

yohnyang的博客

03-13

1388

（19）目标检测算法之模型预测并保存结果到xml中，自动生成标签文件/自动标注

修改xml文件标签名称、筛选xml文件中的指定标签

qq_39445441的博客

09-20

1942

在模型训练和数据标注的时候经常出现一些需要修改标签信息的情况，或者说想要单独整理一类的标签出来审核或者训练，通常我们用labelimg来一张张图片审核修改是非常吃力的，所以我写了一个脚本方便大家对标签信息做一些自动化操作。注意：我这里为了防止误操作都是将数据修改之后保存到一个新的路径而不是替换原来的文件，如果需要可以自己修改一下代码。

深度学习常用的工具（2）批量修改xml文件中的标签属性

12-21

深度学习常用的工具（2）批量修改xml文件中的标签属性 """ 批量修改xml文件中的标签属性对folder,filename和path内容进行修改，并同时去除文件名中的中文汉字 """ import re import os import xml.etree.ElementTree as ET def change_xml(xml_path): filelist = os.listdir(xml_path) # 打开xml文档 for xmlfile in filelist: # print(xmlfile) doc = ET.pa

快速修改xml文件的种类名

weixin_49783489的博客

04-07

328

path = r'D:/hak/huangbandata/cc/真实木虱图像及标签文件/CC128xml/' #存储标签的路径，修改为自己的Annotations标签路径。member.find('name').text = str('0') #替换的标签名字。if objectname == 'MS': #原来的标签名字。通过解析xml文件，批量修改xml文件里的标签名称，比如把标签zero改成num。#######对所有目标进行解析。##########获取根节点。

目标检测项目中，使用python+xml.etree.ElementTree修改xml格式标注文件中的类别名称

limengshi138392的博客

08-26

967

目标检测项目中，使用python+xml.etree.ElementTree修改xml格式标注文件中的类别名称

目标检测中常见的报错以及解决方案

qq_42731393的博客

01-15

1447

1. no such way or no such dictionary 解决方法：不要有中文路径相对路径不要写错

【目标检测】一文干翻xml文件的读取

向往有那么一天梦幻的步态识别落地，开花❀！

10-10

2059

在目标检测中xml文件的读取非常常见，常常要用到labelimg、labelme等标注软件，打标时往往需要打开xml文件，但奈何一直没找到一篇完整的文章，故自己打算手写一篇。下面介绍利用python解析xml文件的方法。

几个对目标检测标签进行常见修改的python代码

爱分享数据的一个人的博客

11-30

1994

两个对VOC标签进行常见修改的python代码

批量修改XML标注文件标签（label）名称

SYGgogogo的博客

12-10

3561

先上代码： """ 通过解析xml文件，批量修改xml文件里的标签名称，改变xml文件的标签 """ import glob import xml.etree.ElementTree as ET path = r'./xml' # 文件夹路径 i = 0 for xml_file in glob.glob(path + '/*.xml'): # 循环读入单个xml文件 # print(xml_file) tree = ET.parse(xml_file) # 读取这个xml文件

如何批量修改xml文件中标签内容

weixin_48227877的博客

03-06

627

【代码】如何批量修改xml文件中标签内容。

数据预处理篇---修改xml的标签

心惠天意

09-30

412

修改xml的标签 # -- coding: utf-8 -- import os import xml.etree.ElementTree as ET origin_ann_dir = r'D:\dataset\third_project\raw_data\20210909\2021-09-09_xml/' # 设置原始标签路径为 Annos new_ann_dir = r'D:\dataset\third_project\raw_data\20210909\2021-09-09_xml1/' # 设

YOLOv10训练自己的数据集目标检测xml

最新发布

03-26

目前尚未有官方发布的 YOLOv10 版本，最新的公开版本为 YOLOv8。因此，以下是基于 YOLOv8 的自定义数据集目标检测教程，并针对 XML 格式的处理方法提供指导。 ### 数据准备 #### 1. 转换标注格式 YOLO 系列模型通常使用 `.txt` 文件存储标签信息，而原始数据可能以 Pascal VOC 的 `.xml` 格式存在。需要编写脚本来完成从 `.xml` 到 `.txt` 的转换[^2]。以下是一个 Python 脚本示例，用于将 Pascal VOC 格式的 XML 文件转换为 YOLO 格式的 TXT 文件： ```python import xml.etree.ElementTree as ET import os def convert(size, box): dw = 1./size[0] dh = 1./size[1] x = (box[0] + box[1]) / 2.0 y = (box[2] + box[3]) / 2.0 w = box[1] - box[0] h = box[3] - box[2] x = x * dw w = w * dw y = y * dh h = h * dh return (x, y, w, h) def convert_annotation(xml_file, output_dir, class_dict): tree = ET.parse(xml_file) root = tree.getroot() size = root.find('size') w = int(size.find('width').text) h = int(size.find('height').text) bnd_id = 0 with open(os.path.join(output_dir, f"{os.path.splitext(os.path.basename(xml_file))[0]}.txt"), 'w') as out_file: for obj in root.iter('object'): difficult = obj.find('difficult').text cls = obj.find('name').text if cls not in list(class_dict.keys()) or int(difficult) == 1: continue cls_id = class_dict[cls] xmlbox = obj.find('bndbox') b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text), float(xmlbox.find('ymax').text)) bb = convert((w, h), b) out_file.write(str(cls_id) + " " + " ".join([f"{i:.6f}" for i in bb]) + '\n') if __name__ == "__main__": input_dir = "/path/to/xml/files" output_dir = "/path/to/txt/files" classes = ["class1", "class2"] # 替换为目标类别名称列表 class_dict = {cls_name: idx for idx, cls_name in enumerate(classes)} for filename in os.listdir(input_dir): if filename.endswith(".xml"): convert_annotation(os.path.join(input_dir, filename), output_dir, class_dict) ``` 此脚本会遍历指定目录中的所有 `.xml` 文件并将其转换为对应的 `.txt` 文件。 --- ### 配置数据集创建 `yaml` 文件来配置数据集路径和参数[^4]。假设已准备好训练、验证和测试的图像及其对应标签文件，则可以按照以下模板编辑 YAML 文件： ```yaml train: path_to_train_images/ val: path_to_val_images/ nc: 2 # 类别数量 names: ['class1', 'class2'] # 类别名 ``` 其中： - `train:` 和 `val:` 应分别指向训练集与验证集中图片所在的文件夹； - `nc:` 表明有多少种不同的物体分类； - `names:` 定义每种类别的具体名字。 --- ### 模型训练进入 YOLOv8 所在的工作空间后，通过命令行启动训练过程[^3]: ```bash cd yolov8_directory pip install -r requirements.txt python train.py --img 640 --batch 16 --epochs 50 --data your_dataset.yaml --weights yolov8s.pt ``` 上述指令解释如下： - `--img`: 输入分辨率大小，默认设置为 640×640 像素。 - `--batch`: 单次迭代所使用的样本数目。 - `--epochs`: 整体循环次数。 - `--data`: 用户自定义的数据集描述文档位置。 - `--weights`: 初始化权重文件地址，可选用预训练好的基础网络结构作为起点。 --- ### 结果评估与优化经过若干轮 epoch 后，程序自动计算 mAP@0.5 及其他指标表现情况。如果发现效果不佳，可以从以下几个方面入手改进： - **调整超参**: 修改学习率 (`lr`) 或增加 batch size 来提升收敛速度。 - **增强数据扩增策略**: 添加随机裁剪、翻转等功能扩充有限资源下的多样性。 - **更换骨干网架构**: 尝试更复杂的 backbone 如 EfficientNet 提升特征提取能力。 ---