目标检测-txt格式转变为xml格式

# -*- coding: utf-8 -*-
# @Time    : 2021/8/2 14:27
# @Author  : zhongls
import cv2
import os
import xml.etree.ElementTree as ET


def xml_txt(txt_path, image_path, path, labels):
    cnt = 0
    # 遍历图片文件夹
    for (root, dirname, files) in os.walk(image_path):
        print(root, dirname, files)
        # 获取图片名
        for ft in files:
            # ft是图片名字+扩展名,替换txt,xml格式
            ftxt = ft.replace(ft.split('.')[1], 'txt')
            fxml = ft.replace(ft.split('.')[1], 'xml')
            # xml文件路径
            xml_path = os.path.join(path, fxml)
            # txt文件路径
            ftxt_path = os.path.join(txt_path, ftxt)
            # 解析xml
            tree = ET.parse(xml_path)
            root = tree.getroot()
            # 获取weight,height
            size = root.find('size')
            w = size.find('width').text
            h = size.find('height').text
            dw = 1 / int(w)
            dh = 1 / int(h)
            # 初始化line
            line = ''
            for item in root.findall('object'):
                # 提取label,并获取索引
                label = item.find('name').text
                label = labels.index(label)
                # 提取信息labels, x, y, w, h
                # 多框转化
                for box in item.findall('bndbox'):
                    xmin = float(box.find('xmin').text)
                    ymin = float(box.find('ymin').text)
                    xmax = float(box.find('xmax').text)
                    ymax = float(box.find('ymax').text)
                    print(xmin, ymin, xmax, ymax)

                    # x, y, w, h归一化
                    center_x = ((xmin + xmax) / 2) * dw
                    center_y = ((ymin + ymax) / 2) * dh
                    bbox_width = (xmax - xmin) * dw
                    bbox_height = (ymax - ymin) * dh
                    print(center_x, center_y, bbox_width, bbox_height)

                    # 传入信息,txt是字符串形式
                    line += '{} {} {} {} {}'.format(label, center_x, center_y, bbox_width, bbox_height) + '\n'

                # 将txt信息写入文件
            with open(ftxt_path, 'w') as f_txt:
                f_txt.write(line)
            cnt += 1
            print('文件数量:', cnt)


if __name__ == '__main__':
    filespath = "C:\\Users\\admin\\Desktop\\need_label\\labels"
    txt_path = os.path.join(filespath, 'txt')  # yolo存放生成txt的文件目录
    image_path = os.path.join(filespath, 'image')  # 存放图片的文件目录
    path = os.path.join(filespath, 'xml')  # 存放xml的文件目录
    labels = ['truck', 'car', 'person', 'motorcycle', 'bus', 'tricycle']  # 用于获取label位置
    xml_txt(txt_path, image_path, path, labels)

### 创建并标注用于目标检测的自定义数据集 (XML 格式) #### 数据收集 构建一个高质量的目标检测数据集首先要获取大量图像样本。这些图像是指那些能够代表实际应用场景中的物体或场景的照片。确保所选图片具有足够的分辨率来清晰显示待识别的对象。 #### 工具选择 对于创建基于 XML 的标签文件来说,LabelImg 是一款非常受欢迎的选择工具之一[^1]。它允许用户通过图形界面轻松地标记矩形框以及分配类名给每一个被标记对象。安装 LabelImg 可以通过 pip 安装 Python 包 `pyqt5` 和 `lxml` 来完成: ```bash pip install pyqt5 lxml git clone https://github.com/tzutalin/labelImg.git cd labelImg make qt5py3 ``` 启动应用程序后即可开始手动绘制边界框并对每张图片内的各个实例进行分类命名操作。 #### 文件结构 当使用像 Pascal VOC 这样的标准格式保存时,每个图像对应单独的一个 .xml 文件作为其元数据描述文档;而所有此类 xml 文档通常会被放置在一个专门为此目的设立的目录下(比如命名为 Annotations)。下面是一个典型的 XML 注解文件的内容概览: ```xml <annotation> <folder>images</folder> <filename>image_0001.jpg</filename> <path>/home/user/images/image_0001.jpg</path> <source> <database>Unknown</database> </source> <size> <width>640</width> <height>480</height> <depth>3</depth> </size> <segmented>0</segmented> <object> <name>bicycle</name> <pose>Unspecified</pose> <truncated>0</truncated> <difficult>0</difficult> <bndbox> <xmin>279</xmin> <ymin>194</ymin> <xmax>355</xmax> <ymax>366</ymax> </bndbox> </object> </annotation> ``` 此模板展示了如何记录单个物品的位置及其属性信息。其中 `<object>` 节点下的子节点分别表示该物体的名字、姿态、截断情况、难度级别和包围盒坐标等细节[^2]。 #### 数据预处理与转换 由于 YOLO 系列算法默认支持的是特定格式的数据输入方式——即所谓的 "YOLO format",因此如果原始数据是以其他形式存在的,则可能需要先做一次格式上的调整工作。例如从上述提到过的 Pascal VOC 或者 COCO JSON 到 YOLO txt转变过程可以通过编写简单的脚本来实现自动化处理。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值