深入理解与构建 ImageNet 数据集
1. ImageNet 文件结构解析
ImageNet 数据集是图像分类算法的事实标准,但在使用其进行实验时,我们会遇到一些限制。例如,测试集的标签是保密的,这使得我们无法直接使用测试集进行实验。因此,我们将从训练数据中采样来创建自己的测试集。
1.1 “test” 目录
测试目录包含一些图像文件,如:
-rw-r--r-- 1 adrian adrian 211157 Jul 1 2012 ILSVRC2012_test_00000006.JPEG
-rw-r--r-- 1 adrian adrian 219906 Jul 1 2012 ILSVRC2012_test_00000007.JPEG
-rw-r--r-- 1 adrian adrian 181734 Jul 1 2012 ILSVRC2012_test_00000008.JPEG
-rw-r--r-- 1 adrian adrian 10696 Jul 1 2012 ILSVRC2012_test_00000009.JPEG
由于测试集标签保密,我们将忽略该目录,从训练数据中构建自己的测试集。
1.2 “train” 目录
训练目录由一系列子目录组成,每个子目录对应一个 WordNet ID,代表一个特定的类别。例如:
$ ls -l Data/CLS-LOC/train/ | head -n 10
total 60
超级会员免费看
订阅专栏 解锁全文
406

被折叠的 条评论
为什么被折叠?



