目标检测VOC2COCO!把xml格式的数据转换为MSCOCO格式数据集,并按自定义比例划分数据集

文章详细介绍了PASCAL_VOC数据集的文件结构,并提供了一个Python脚本,该脚本用于将VOC格式转换为COCO格式,特别是针对遥感领域的DIOR数据集。此外,还展示了如何将一个完整的COCO数据集按比例划分为训练、验证和测试集。

一、PASCAL_VOC形式的数据集文件组织形式

VOCdevkit/
|__ VOC2007/
   |__ Annotations/ (这里存放着每一张图片的XML注解文件,如 000001.xml)
   |__ ImageSets/ (这里包含不同任务或不同类别的图像文件名列表)
      |__ Main/ (例如,train.txt, val.txt, trainval.txt, test.txt)
      |__ Layout/ (布局任务的图像集,例如,train.txt, val.txt, trainval.txt, test.txt)
      |__ Segmentation/ (分割任务的图像集,例如,train.txt, val.txt, trainval.txt, test.txt)
   |__ JPEGImages/ (这里存放着数据集中的所有JPEG图像,如 000001.jpg)
   |__ SegmentationClass/ (这里包含分割类别标签的图像)
   |__ SegmentationObject/ (这里包含分割目标标签的图像)

二、VOC2COCO.py 数据转换

这里以遥感中的DIOR数据集为例(DIOR采用的就是PASCAL_VOC数据集的文件组织形式)

 一般VOC数据集都提前划分好了train.txt,val.txt, test.txt,所以以下代码是直接按照这三个文件list来读取的。代码如下:

import os
import json
import xml.etree.ElementTree as ET
from typing import List, 
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值