自然图像数据库与CBIR系统介绍
1. 自然图像数据库
1.1 CIFAR 10数据库
CIFAR 10数据库包含总计60,000张图像,分为10个类别,每个类别有6000张图像。这些类别的名称分别是:飞机、汽车、鸟类、猫、鹿、狗、青蛙、马、船和卡车。图像之间的高度异质性和差异性使该数据库在图像召回检索研究中广受欢迎。这些类别完全相互排斥,例如卡车和汽车之间没有相似性。不过,该数据库存在一个问题,即一些类别(如鹿 - 狗、马 - 狗和马 - 鹿)的真实图像存在重叠。
数据集分为五个训练批次和一个测试批次,每个批次有10,000张图像。测试批次恰好包含每个类别中随机选择的1000张图像。训练批次以随机顺序包含其余图像,但某些训练批次可能包含来自某个类别的图像比其他类别更多。总体而言,训练批次中每个类别恰好有5000张图像。
1.2 CIFAR - 100数据库
CIFAR - 100数据库是CIFAR 10的变体。该数据集包含100个类别,每个类别有600张图像,其中包括500张训练图像和测试图像。这100个类别进一步聚类为20个超类。相关性计算基于细标签(所属类别)和粗标签(所属超类)。以下是CIFAR - 100数据库中的类别:
| 超类 | 类别 |
| — | — |
| 水生哺乳动物 | 海狸、海豚、水獭、海豹、鲸鱼 |
| 鱼类 | 水族馆鱼、比目鱼、鳐鱼、鲨鱼、鳟鱼 |
| 花卉 | 兰花、罂粟花、玫瑰、向日葵、郁金香 |
| 食品容器 | 瓶子、碗、罐子、杯子、盘子 |
| 水果和蔬菜 | 苹果、蘑菇、橙子、梨、甜椒 |
| 家用电气设备
自然图像数据库与CBIR系统综述
超级会员免费看
订阅专栏 解锁全文
7604

被折叠的 条评论
为什么被折叠?



