文章目录
一、ImageNet
ImageNet 数据集包含根据 WordNet 层次结构的 14,197,122 个带注释的图像。 自 2010 年以来,该数据集被用于 ImageNet 大规模视觉识别挑战赛 (ILSVRC),这是图像分类和对象检测的基准。 公开发布的数据集包含一组手动注释的训练图像。 还发布了一组测试图像,但保留了手动注释。 ILSVRC 注释分为两类之一:(1)图像级注释,用于表示图像中是否存在对象类的二进制标签,例如“该图像中有汽车”但“没有老虎, ” 和 (2) 图像中对象实例周围的紧密边界框和类标签的对象级注释,例如,“有一把螺丝刀,其中心位置为 (20,25),宽度为 50 像素,高度为 30 像素 ”。 ImageNet 项目不拥有图像的版权,因此仅提供图像的缩略图和 URL。
- 非空 WordNet 同义词集总数:21841
- 图片总数:14197122
- 带边界框注释的图像数量:1,034,908
- 具有 SIFT 特征的同义词集数量:1000
- 具有SIFT特征的图像数量:120万张