如何将VOC XML文件转化成COCO数据格式

最新推荐文章于 2025-05-15 20:06:02 发布

Michael Cong

最新推荐文章于 2025-05-15 20:06:02 发布

阅读量1.6k

点赞数

CC 4.0 BY-SA版权

分类专栏：数据集文章标签：数据集转换

本文链接：https://blog.youkuaiyun.com/MichalCong/article/details/98718024

本文详细介绍了如何将VOC的XML标注文件转换为COCO数据格式，包括COCO数据结构的解析，XML文件内容的解析，并提供了一段Python代码示例进行转换。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

数据转换实在是个烦人的工作，被折磨了很久决定抽出时间整理一下，仅供参考。

在一个项目中，我需要将已有的VOC的xml标注文件转化成COCO的数据格式，为了方便理解，文章按如下顺序介绍：

XML文件内容长什么样
COCO的数据格式长什么样
XML如何转化成COCO格式
VOC XML长什么样？
下面我只把重要信息题练出来，如下所示：

文件夹目录图片名.jpg path_to\at002eg001.jpg Unknown 550 518 3 0 Apple Unspecified 0 0 292 218 410 331 ... 可以看到一个xml文件包含如下信息：

folder: 文件夹
filename：文件名
path：路径
source：我项目里没有用到
size：图片大小
segmented：图像分割会用到，本文仅以目标检测（bounding box为例进行介绍）
object：一个xml文件可以有多个object，每个object表示一个box，每个box有如下信息组成：
name：改box框出来的object属于哪一类，例如Apple
bndbox：给出左上角和右下角的坐标
truncated:略
difficult：略

COCO长什么样？

COCO目录啥样？

COCO的json文件啥样？

一个标准的json文件包含如下信息：

{
“info”: info,
“images”: [image],
“annotations”: [annotation],
“licenses”: [license],
}

info{
“year”: int,
“version”: str,
“description”: str,
“contributor”: str,
“url”: str,
“date_created”: datetime,
}
image{
“id”: int,
“width”: int,
“height”: int,
“file_name”: str,
“license”: int,
“flickr_url”: str,
“coco_url”: str,
“date_captured”: datetime,
}
license{
“id”: int,
“name”: str,
“url”: str,
}
是不是有点抽象？官网就是这样的，酸爽不酸爽，反正我看