Open Images Dataset 完整使用指南

Open Images Dataset 完整使用指南

【免费下载链接】dataset The Open Images dataset 【免费下载链接】dataset 项目地址: https://gitcode.com/gh_mirrors/dat/dataset

Open Images Dataset 是一个由谷歌发起的大规模图像数据集,包含了约900万张标注图像,涵盖了数千个对象类别。该数据集提供了图像级标签和边界框标注,是计算机视觉和机器学习研究的理想资源。

环境准备要求

在开始使用之前,请确保您的系统满足以下基本要求:

  • Python 3.6 或更高版本
  • Git 版本控制工具
  • 至少50GB可用磁盘空间
  • 稳定的网络连接

快速安装配置步骤

获取项目代码

首先需要克隆项目仓库到本地:

git clone https://gitcode.com/gh_mirrors/dat/dataset

进入项目目录

切换到项目文件夹:

cd dataset

安装Python依赖

项目主要依赖以下Python库:

  • boto3:用于AWS S3访问
  • tqdm:进度条显示
  • botocore:AWS核心库

可以使用pip安装所需依赖:

pip install boto3 tqdm botocore

数据集结构详解

Open Images Dataset 包含三个主要的数据集划分:

  • 训练集:9,011,219张图像
  • 验证集:41,620张图像
  • 测试集:125,436张图像

数据集标注类型

图像级标签

  • 机器生成标签:78,977,695个(7,870个类别)
  • 人工验证标签:20,868,755个(19,693个类别)

标注示例

边界框标注

  • 训练集:3,709,509个边界框(600个类别)
  • 验证集:204,621个边界框
  • 测试集:625,282个边界框

数据下载方法

使用下载器脚本

项目提供了专门的下载工具 downloader.py,可以批量下载指定图像列表。使用方法如下:

python downloader.py image_list.txt --num_processes 10 --download_folder ./images

下载数据文件

数据集包含以下主要文件:

  • 图像URL和元数据
  • 边界框标注文件
  • 人工验证的图像级标签
  • 机器生成的图像级标签
  • 类别和类别描述

数据格式说明

图像列表格式 (images.csv)

ImageID,Subset,OriginalURL,OriginalLandingURL,License,AuthorProfileURL,Author,Title,OriginalSize,OriginalMD5,Thumbnail300KURL

边界框标注格式

ImageID,Source,LabelName,Confidence,XMin,XMax,YMin,YMax,IsOccluded,IsTruncated,IsGroupOf,IsDepiction,IsInside

类别描述格式 (class-descriptions.csv)

/m/025dyy,Box
/m/025f_6,Dussehra
/m/025fh,Professor x

数据集统计信息

标签分布统计

训练集标签频率 验证集标签频率 测试集标签频率

边界框分布统计

训练集边界框频率 验证集边界框频率 测试集边界框频率

实用工具介绍

项目提供了多个实用工具来帮助处理数据:

分类工具

  • tools/classify.py:基础分类工具
  • tools/classify_oidv2.py:V2版本分类工具

数据处理工具

  • tools/compute_bottleneck.py:计算瓶颈特征

数据下载脚本

  • tools/download_data.sh:下载预训练模型

使用示例

下载特定图像

创建一个图像列表文件 image_list.txt,内容格式如下:

train/f9e0434389a1d4dd
train/1a007563ebc18664
test/ea8bfd4e765304db

然后运行下载命令:

python downloader.py image_list.txt

浏览边界框层次结构

可以通过项目提供的HTML文件查看边界框的语义层次结构:

bbox_labels_vis.html

注意事项

  • 数据集文件体积较大,建议使用SSD硬盘以获得更好的读写性能
  • 下载时选择网络状况较好的时段,避免中断
  • 验证Python版本与项目要求匹配
  • 确保有足够的存储空间来存储数据集文件

开始使用

现在您已经成功配置了Open Images Dataset,可以开始:

  • 探索数据集中的图像和标注
  • 使用提供的工具进行数据处理
  • 开发自己的计算机视觉模型

通过本指南,您应该能够顺利安装和使用Open Images Dataset进行各种计算机视觉任务的研究和开发。

【免费下载链接】dataset The Open Images dataset 【免费下载链接】dataset 项目地址: https://gitcode.com/gh_mirrors/dat/dataset

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值