超级简单的VOC2007数据集制作——使用自制的VOC2007数据集制作工具

使用自制VOC2007数据集制作工具

 

数据集制作工具下载链接

 

本人win10 64位系统 操作没有问题(其他系统没有试过),在有的机子测试会出现应用程序无法正常启动0xc0000007b,请从以下几个方面排查

1.创建文件夹

首先创建一个名字为VOC2007的文件夹,在该文件夹下再分别创建Annotations、ImageSets、JPEGImages三个子文件夹以及一个文本文件(名字任意)我新建一个叫output.txt,再ImageSets文件夹下创建名为Main的文件夹

 

2.将训练图片放到JPEGImages

将训练图片放到JPEGImages下,我这里随便弄了20张做个演示

3.使用我们自制的VOC2

### 创建并标注用于目标检测的自定义数据集 (XML 格式) #### 数据收集 构建一个高质量的目标检测数据集首先要获取大量图像样本。这些图像是指那些能够代表实际应用场景中的物体或场景的照片。确保所选图片具有足够的分辨率来清晰显示待识别的对象。 #### 工具选择 对于创建基于 XML 的标签文件来说,LabelImg 是一款非常受欢迎的选择工具之一[^1]。它允许用户通过图形界面轻松地标记矩形框以及分配类名给每一个被标记对象。安装 LabelImg 可以通过 pip 安装 Python 包 `pyqt5` 和 `lxml` 来完成: ```bash pip install pyqt5 lxml git clone https://github.com/tzutalin/labelImg.git cd labelImg make qt5py3 ``` 启动应用程序后即可开始手动绘制边界框并对每张图片内的各个实例进行分类命名操作。 #### 文件结构 当使用像 Pascal VOC 这样的标准格式保存时,每个图像对应单独的一个 .xml 文件作为其元数据描述文档;而所有此类 xml 文档通常会被放置在一个专门为此目的设立的目录下(比如命名为 Annotations)。下面是一个典型的 XML 注解文件的内容概览: ```xml <annotation> <folder>images</folder> <filename>image_0001.jpg</filename> <path>/home/user/images/image_0001.jpg</path> <source> <database>Unknown</database> </source> <size> <width>640</width> <height>480</height> <depth>3</depth> </size> <segmented>0</segmented> <object> <name>bicycle</name> <pose>Unspecified</pose> <truncated>0</truncated> <difficult>0</difficult> <bndbox> <xmin>279</xmin> <ymin>194</ymin> <xmax>355</xmax> <ymax>366</ymax> </bndbox> </object> </annotation> ``` 此模板展示了如何记录单个物品的位置及其属性信息。其中 `<object>` 节点下的子节点分别表示该物体的名字、姿态、截断情况、难度级别和包围盒坐标等细节[^2]。 #### 数据预处理与转换 由于 YOLO 系列算法默认支持的是特定格式的数据输入方式——即所谓的 "YOLO format",因此如果原始数据是以其他形式存在的,则可能需要先做一次格式上的调整工作。例如从上述提到过的 Pascal VOC 或者 COCO JSON 到 YOLO txt 的转变过程可以通过编写简单的脚本来实现自动化处理。
评论 28
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值