1.需求背景:
现在手上有一份目标检测数据集,这个数据集很大,总共10万张图片,对应10万个xml文件,我们可以使用标注工具labelimg打开查看数据集,人工统计数据集中标签的名称,但是,数据集太大,人工统计费时费力,而且很容易出出错,因此需要写一个脚本代码实现获取xml文件中所有标签名称。
2.需求分析
查看xml文件中的内容:

我们主要提取xml文件中的类别名称
<object>
<name>ore carrier</name>
</object>
总结:通过遍历xml文件中的name,将name中的类别添加到一个列表,再将列表去重,得到整个数据集的类别名称。
3.代码实现
# -*- coding: utf-8 -*-
"""
Created on Mon Nov 28 08:26:28 2022
@author: zqq
"""
这篇博客介绍了如何在Python中通过脚本自动化获取大规模目标检测数据集XML文件中的标签名称,以替代手动统计。文章详细阐述了需求背景,分析了需求,并提供了一段简洁的代码实现,确保在Windows系统下Python 3.6.10环境下运行。代码优化了网上找到的原有实现,提高了可读性。
订阅专栏 解锁全文
915

被折叠的 条评论
为什么被折叠?



