在Open Images V4快速下载需要的数据集

该博客指导如何查询OpenImageV4数据集中所需的类别,并从GitHub下载相关工具包。按照README指示,将所需类别如'Handgun', 'Shotgun', 'Knife', 'Axe', 'Hammer'等写入classes.txt文件,然后运行python main.py downloader --classes...命令进行数据下载。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.查询open image v4是否有我们需要的类别

在这个网页中查询,那个search框框

2.github上下载这个工具包

项目地址

3.按照readme指示,将所需类别写进项目中的classes.txt中,再运行命令即可。

如:python main.py downloader --classes Handgun Shotgun Knife Axe Hammer --type_csv all

### 关于Open Images 数据集版本4的信息 #### 数据集概述 Open Images 是一个大规模的图像数据集,旨在促进计算机视觉研究的发展。第四版(v4)显著扩展了先前版本的内容,在数量和多样性方面都有所提升[^2]。 #### 图像标签类别 此版本包含了超过9百万张图片的人工标注信息。这些图像是从网络上收集而来并经过精心筛选以确保质量。对于每一张照片,都提供了详细的元数据描述以及边界框位置来指示目标物体所在区域。 #### 类别细分 为了便于理解和应用,所有标记被分为多个层次结构下的细粒度分类体系。这不仅有助于提高模型训练效率,还使得研究人员能够更精确地定义任务需求。例如,在自动驾驶领域内使用的Waymo开放平台也依赖类似的高质量多模态感知数据来进行算法优化和发展[^1]。 #### 应用场景 由于其丰富的语义信息和广泛的覆盖范围,该数据集非常适合用于开发先进的机器学习解决方案,特别是在对象检测、实例分割等领域有着广泛的应用前景。此外,通过与其他资源相结合,还可以探索更多可能性,比如跨域迁移学习等高级课题的研究。 ```python import tensorflow as tf from object_detection.utils import dataset_util def create_tf_record(image_paths, label_map_dict): writer = tf.io.TFRecordWriter('output.tfrecord') for idx, path in enumerate(image_paths): with tf.io.gfile.GFile(path, 'rb') as fid: encoded_jpg = fid.read() filename = path.split('/')[-1].encode('utf8') width, height = Image.open(io.BytesIO(encoded_jpg)).size xmins = [] xmaxs = [] ymins = [] ymaxs = [] classes_text = [] classes = [] # 假设我们已经得到了bounding box坐标和对应的label id for bbox, class_id in get_bounding_boxes_and_labels(idx): xmins.append(bbox['xmin'] / width) xmaxs.append(bbox['xmax'] / width) ymins.append(bbox['ymin'] / height) ymaxs.append(bbox['ymax'] / height) classes_text.append(label_map_dict[class_id]) classes.append(class_id) tf_example = tf.train.Example(features=tf.train.Features(feature={ 'image/height': dataset_util.int64_feature(height), 'image/width': dataset_util.int64_feature(width), 'image/filename': dataset_util.bytes_feature(filename), 'image/source_id': dataset_util.bytes_feature(filename), 'image/encoded': dataset_util.bytes_feature(encoded_jpg), 'image/format': dataset_util.bytes_feature(b'jpg'), 'image/object/bbox/xmin': dataset_util.float_list_feature(xmins), 'image/object/bbox/xmax': dataset_util.float_list_feature(xmaxs), 'image/object/bbox/ymin': dataset_util.float_list_feature(ymins), 'image/object/bbox/ymax': dataset_util.float_list_feature(ymaxs), 'image/object/class/text': dataset_util.bytes_list_feature(classes_text), 'image/object/class/label': dataset_util.int64_list_feature(classes), })) writer.write(tf_example.SerializeToString()) writer.close() ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值