yolo格式

最新推荐文章于 2025-04-19 09:40:25 发布

ZHOU_CAMP

最新推荐文章于 2025-04-19 09:40:25 发布

阅读量1.1k

点赞数 13

分类专栏： ultralytics 文章标签： YOLO 人工智能

本文链接：https://blog.youkuaiyun.com/qq_41472205/article/details/145808315

版权

ultralytics 专栏收录该内容

2 篇文章

订阅专栏

yolo格式

YOLO（You Only Look Once）格式通常用于目标检测任务中的标注数据格式。YOLO的标注格式包括每个目标的类别和其在图像中的位置（bounding box）。YOLO格式的标注文件是一个文本文件，每一行表示一个目标，内容包括目标类别的编号和该目标在图像中的位置（相对于图像的比例）。

具体的YOLO标注格式如下：

<类别编号> <x_center> <y_center> <width> <height>

<类别编号>：目标类别的编号，通常从0开始编号。
<x_center> 和 <y_center>：目标框中心点的坐标，值是相对于图像宽度和高度的比例，取值范围为0到1。
<width> 和 <height>：目标框的宽度和高度，值也是相对于图像宽度和高度的比例，取值范围为0到1。

例如，如果有一个标注文件image1.txt，内容可能是这样的：

0 0.5 0.5 0.2 0.3
1 0.75 0.4 0.1 0.2

这表示：

第一个目标是类别0，位于图像中心（x_center=0.5，y_center=0.5），宽度为图像宽度的20%（0.2），高度为图像高度的30%（0.3）。
第二个目标是类别1，中心点坐标为（0.75，0.4），宽度为图像宽度的10%（0.1），高度为图像高度的20%（0.2）。

标注文件通常与图像文件同名，除了扩展名不同。例如，image1.jpg对应的标注文件是image1.txt。

yolo格式与coco格式的区别

YOLO格式和COCO格式是两种常见的目标检测数据标注格式，它们有一些重要的区别，主要体现在数据存储方式、标注细节和应用场景上。

1. 数据结构

YOLO格式：
- 每张图像对应一个单独的文本文件（.txt），该文本文件包含图像中所有目标的标注。
- 每行表示一个目标，包含类别编号、bounding box的中心坐标和宽高（都是相对于图像的比例）。
- 标注数据简单且直接，易于处理，适用于实时检测系统。
示例：
```
0 0.5 0.5 0.2 0.3
1 0.75 0.4 0.1 0.2
```

COCO格式：

COCO格式是基于JSON的结构，包含了详细的标注信息。它不仅包含图像的目标信息（类别、bounding box），还包含其他附加信息，如图像的尺寸、图像ID、目标的遮挡情况、分割标注等。
COCO格式的文件通常包含一个大结构体，分为多个部分，例如 images, annotations, categories 等。

示例（简化版）：

{
    "images": [
        {
            "id": 1,
            "file_name": "image1.jpg",
            "height": 720,
            "width": 1280
        }
    ],
    "annotations": [
        {
            "id": 1,
            "image_id": 1,
            "category_id": 1,
            "bbox": [640, 360, 256, 432],
            "area": 110592,
            "iscrowd": 0
        }
    ],
    "categories": [
        {
            "id": 1,
            "name": "person"
        }
    ]
}

2. 标注内容

YOLO格式：
- 每个目标只包括类别编号和bounding box的中心坐标、宽度、高度（相对比例）。YOLO格式不包含目标的其他细节（如遮挡、分割等）。
COCO格式：
- 除了类别、bounding box等信息，COCO格式还可以包含更多信息：
  - Segmentation：目标的分割标注，可以是多边形坐标或者RLE（Run-Length Encoding）格式。
  - 区域遮挡：标注目标是否被遮挡（iscrowd）。
  - 目标ID：每个目标都有一个唯一ID。
  - 图像信息：图像尺寸、文件名等。

3. 文件格式

YOLO格式：
- 文件是纯文本文件（.txt），每张图片对应一个文本文件，便于快速查看和编辑。
COCO格式：
- 数据存储在一个JSON文件中，这使得COCO格式更适合大规模数据集和复杂的标注任务。JSON文件可以存储更多结构化的信息，但相对较难手动编辑。

4. 扩展性

YOLO格式：
- YOLO格式相对简单且专注于目标检测任务，扩展性较弱，不支持复杂的标注任务（如分割、遮挡等）。
COCO格式：
- COCO格式设计上支持多种类型的任务，不仅限于目标检测，还支持图像分割、关键点检测、人员识别等。COCO格式更加通用和灵活，适合大规模多任务的研究。

5. 应用场景

YOLO格式：
- 更适用于实时检测任务（如YOLO系列模型），因其简单和高效，标注文件小且容易读取，适合需要快速加载标注的场景。
COCO格式：
- 适用于更复杂的标注任务和大规模数据集，COCO格式在学术界和工业界广泛使用，尤其是在多任务学习和分割任务中。COCO的数据结构也便于整合多种类型的数据，并进行丰富的分析。