文章目录
- 一、COCO (Microsoft Common Objects in Context)
- 二、Cityscapes
- 三、KITTI
- 四、ShapeNet
- 五、ScanNet
- 六、ADE20K
- 七、NYUv2 (NYU-Depth V2)
- 八、DAVIS (Densely Annotated VIdeo Segmentation)
- 九、SYNTHIA (SYNTHetic Collection of Imagery and Annotations)
- 十、SUN RGB-D
- 十一、S3DIS (Stanford 3D Indoor Scene Dataset (S3DIS))
- 十二、GTA5 (Grand Theft Auto 5)
- 十三、PASCAL VOC (PASCAL Visual Object Classes Challenge)
- 十四、EuroSAT
- 十五、BDD100K
一、COCO (Microsoft Common Objects in Context)
MS COCO(Microsoft Common Objects in Context)数据集是一个大规模的对象检测、分割、关键点检测和字幕数据集。 该数据集由 328K 图像组成。
分割:MS COCO 数据集的第一个版本于 2014 年发布。它包含 164K 图像,分为训练集 (83K)、验证集 (41K) 和测试集 (41K)。 2015年发布了额外的81K图像测试集,包括之前的所有测试图像和40K新图像。
根据社区反馈,2017 年训练/验证比例从 83K/41K 更改为 118K/5K。 新的分割使用相同的图像和注释。 2017 年测试集是 2015 年测试集 41K 图像的子集。 此外,2017 年版本还包含一个新的未注释的 123K 图像数据集。
注释:数据集有注释
对象检测:具有 80 个对象类别的边界框和每个实例分割掩模,
字幕:图像的自然语言描述(参见 MS COCO 字幕),
关键点检测:包含超过 200,000 张图像和 250,000 个用关键点标记的人物实例(17 个可能的关键点,例如左眼、鼻子、右臀部、右脚踝),
东西图像分