第三卷 第二章 什么是ImageNet?
在本章中,我们将讨论 ImageNet 数据集和相关的 ImageNet 大规模视觉识别挑战 (ILSVRC) 。 这一挑战是评估图像分类算法的事实上的基准。 自2012年 Krizhevsky 等人提出以来,ILSVRC 的排行榜一直由卷积神经网络和深度学习技术主导。 发表了他们开创性的 AlexNet 工作。
从那时起,深度学习方法不断扩大 CNN 与其他传统计算机视觉分类方法之间的准确性差距。 毫无疑问,CNN 是强大的图像分类器。 在本章的后半部分,我们将探讨如何获取 ImageNet 数据集,这是您在本章后面复制最先进的神经网络结果的必要条件。
1、ImageNet 数据集
ImageNet 实际上是一个项目,旨在根据一组定义的单词和短语将图像标记和分类为所有22,000个类别。在撰写本文时,ImageNet 项目中有超过1400万张图像。
那么,ImageNet是如何组织的?为了对如此大量的数据进行排序,ImageNet实际上遵循WordNet层次结构。