COCO 数据集

最新推荐文章于 2025-07-10 09:44:41 发布

YZXnuaa

最新推荐文章于 2025-07-10 09:44:41 发布

阅读量1.8k

点赞数

CC 4.0 BY-SA版权

分类专栏：数据

本文链接：https://blog.youkuaiyun.com/YZXnuaa/article/details/80536367

本文介绍了COCO数据集，包括其提供的物体检测、分割和语义描述信息。详细阐述了如何获取和安装COCO的图像及标签数据，以及使用Python API进行数据解析和可视化。在Windows环境下，提到了安装过程中的常见问题及其解决方案，并展示了通过API展示类别、实例注释、关键点和标题注释的方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

微软发布的COCO数据库, 除了图片以外还提供物体检测, 分割(segmentation)和对图像的语义文本描述信息.
COCO数据库的网址是:

MS COCO API - http://mscoco.org/
Github网址 - https://github.com/pdollar/coco
关于API更多的细节在网站: http://mscoco.org/dataset/#download

数据库提供 Matlab, Python 和 Lua 的 API 接口. 其中 matlab 和 python 的 API 接口可以提供完整的图像标签数据的加载, parsing 和可视化.此外,网站还提供了数据相关的文章, 教程等.

在使用 COCO 数据库提供的 API 和 demo 时, 需要首先下载 COCO 的图像和标签数据.

安装:
1. 首先解压数据文件:
  - 图像数据下载到 coco/images/ 文件夹中
  - 标签数据下载到 coco/ 文件夹中.
2. matlab, 在 matlab 的默认路径中添加 coco/MatlabApi
3. Python. 打开终端,将路径切换到 coco/PythonAPI下,输入 make
COCO数据集的标注信息

COCO的数据标注信息包括:

类别标志
类别数量区分
像素级的分割

import sys
sys.path.append('E:/xinlib')
from data import cocox
import zipfile

查看 coco/images/ 文件夹下的数据：

image_names = cocox.get_image_names()
image_names

['E:/Data/coco/images/test2017.zip',
 'E:/Data/coco/images/train2017.zip',
 'E:/Data/coco/images/unlabeled2017.zip',
 'E:/Data/coco/images/val2017.zip']

查看 coco/ 文件夹的文件：

import os
dataDir = cocox.root

os.listdir(dataDir)

['annotations',
 'annotations_trainval2017.zip',
 'cocoapi',
 'images',
 'image_info_test2017.zip',
 'image_info_unlabeled2017.zip',
 'stuff_annotations_trainval2017.zip']

我们只需要获取 annotations 的信息（这里都是以 .zip 结尾）：

annDir = [z_name for z_name in os.listdir(dataDir) if z_name.endswith('.zip')]
annDir

['annotations_trainval2017.zip',
 'image_info_test2017.zip',
 'image_info_unlabeled2017.zip',
 'stuff_annotations_trainval2017.zip']

解压 annotations 的文件：

for ann_name in annDir:
    z = zipfile.ZipFile(dataDir + '/' + ann_name)
    # 全部解压
    z.extractall(dataDir)

# 封装为函数
cocox.unzip_annotations()

# 删除标签的压缩文件
cocox.del_annotations()

由于图片数据比较大，我就不解压了，不过可以通过 MXNet + zipfile 来直接获取图片信息。

获取图片数据

我以 test2017.zip 为例：

image_names

['E:/Data/coco/images/test2017.zip',
 'E:/Data/coco/images/train2017.zip',
 'E:/Data/coco/images/unlabeled2017.zip',
 'E:/Data/coco/images/val2017.zip']

z = zipfile.ZipFile(image_names[0])

# 测试集的图片名称列表
z.namelist()

最低0.47元/天解锁文章

200万优质内容无限畅学