【计算机视觉 | 目标检测】目标检测常用数据集及其介绍(七)

本文介绍了15个目标检测数据集,包括Cops-Ref、FAT、GEN1 Detection等,涵盖了机器人技术、遥感图像、微生物菌落、行人检测、杂货分类、光场数据等多个领域,为深度学习和目标检测研究提供了丰富资源。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、Cops-Ref

Cops-Ref 是一个在引用表达理解的背景下进行视觉推理的数据集,具有两个主要特征。

在这里插入图片描述

二、FAT (Falling Things)

Falling Things (FAT) 是一个数据集,用于推进机器人技术背景下物体检测和 3D 姿态估计的最先进水平。 它由生成的真实感图像组成,并为 60k 图像中的所有对象提供准确的 3D 姿势注释。

21 个家居物品的 6 万张带注释的照片取自 YCB 物品集。 对于每个图像,数据集包含所有对象的 3D 姿势、每像素类分割以及 2D/3D 边界框坐标。

在这里插入图片描述

三、GEN1 Detection (Prophesee GEN1 Automotive Detection Dataset)

Prophesee 的 GEN

### 关于 TrashCan 数据集的信息 TrashCan 数据集是一个用于目标检测数据集,专注于识别不同类型的垃圾箱及其状态(例如是否溢出)。该数据集采用 VOC 和 YOLO 格式,包含三个类别,总计 3493 张图像[^3]。以下是有关此数据集的下载和使用方法的具体说明: #### 下载链接 TrashCan 数据集可以通过以下链接获取: - **下载地址**: https://download.youkuaiyun.com/download/FL1623863129/89700009 #### 文件结构 下载并解压后,数据集通常会按照标准的目标检测框架格式组织。如果参考 mmdetection 的文件夹结构,则可以预期类似的布局[^2]: ``` TrashCan/ ├── annotations/ │ ├── train.json │ └── val.json ├── images/ │ ├── train2017/ │ │ ├── image_0001.jpg │ │ └── ... │ └── val2017/ │ ├── image_0002.jpg │ └── ... └── labels/ ├── train2017/ │ ├── image_0001.txt │ └── ... └── val2017/ ├── image_0002.txt └── ... ``` - `annotations` 存放 JSON 格式的标注文件。 - `images/train2017` 和 `val2017` 分别存储训练集和验证集的图片。 - 如果是 YOLO 格式,标签文件将以 `.txt` 形式存放在对应的子目录中。 #### 使用说明 为了在深度学习框架中使用 TrashCan 数据集,需完成以下几个方面的工作: 1. **安装依赖库** 需要确保已安装支持目标检测任务的相关工具包。例如,在 PyTorch 中可使用 MMDetection 或 Detectron2 进行训练。以 MMDetection 为例,可通过以下命令安装: ```bash pip install mmcv-full mmdet ``` 2. **配置文件调整** 创建或修改配置文件以适配 TrashCan 数据集。假设使用的是 COCO 格式,可以在配置文件中指定路径: ```python data_root = 'path/to/TrashCan/' train_dataset = dict( type='CocoDataset', ann_file=data_root + 'annotations/train.json', img_prefix=data_root + 'images/train2017/', pipeline=train_pipeline) val_dataset = dict( type='CocoDataset', ann_file=data_root + 'annotations/val.json', img_prefix=data_root + 'images/val2017/', pipeline=test_pipeline) ``` 3. **模型训练** 启动训练过程前,请确认 GPU 资源可用,并运行脚本启动训练: ```bash python tools/train.py configs/trashcan_config.py --gpu-id 0 ``` #### 注意事项 - 若数据集中存在未标准化的标注信息,可能需要先对其进行预处理,例如统一尺寸或修正边界框坐标。 - 对于较小规模的数据集,建议启用数据增强技术来提升泛化能力。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

旅途中的宽~

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值