自然图像数据库与流行的CBIR系统介绍
1. 自然图像数据库
在图像研究领域,有多种自然图像数据库可供使用,这些数据库各具特点,适用于不同的研究场景。
1.1 CIFAR 10 Database
CIFAR数据库总共包含60,000张图像,分为10个类别,每个类别有6000张图像。这些类别的名称分别是:飞机、汽车、鸟、猫、鹿、狗、青蛙、马、船和卡车。图像之间的高度异质性和差异性使得该数据库在图像和召回检索的研究活动中广受欢迎。类别之间是完全互斥的,例如卡车和汽车之间没有相似性。不过,该数据库存在一个问题,即一些类别之间的真实图像存在重叠,如鹿 - 狗、马 - 狗和马 - 鹿。
数据集分为五个训练批次和一个测试批次,每个批次有10,000张图像。测试批次包含从每个类别中随机选择的1000张图像。训练批次以随机顺序包含其余图像,但某些训练批次可能包含来自某个类别更多的图像。总体而言,训练批次中每个类别恰好包含5000张图像。
1.2 CIFAR - 100 Database
CIFAR - 100数据库是CIFAR 10的变体。该数据集包含100个类别,每个类别有600张图像,其中包括500张训练图像和测试图像。这100个类别进一步聚类为20个超类。相关性计算基于细标签(所属的类别)和粗标签(所属的超类)。以下是CIFAR - 100数据库中的类别:
| 超类 | 类别 |
| — | — |
| 水生哺乳动物 | 海狸、海豚、水獭、海豹、鲸鱼 |
| 鱼类 | 水族馆鱼、比目鱼、鳐鱼、鲨鱼、鳟鱼 |
| 花卉 | 兰花、罂粟花、玫瑰、向日葵、郁金香 |
| 食品容器 | 瓶子、碗、
超级会员免费看
订阅专栏 解锁全文

12

被折叠的 条评论
为什么被折叠?



