1. 背景介绍
1.1. ImageNet 竞赛与图像识别
ImageNet 大规模视觉识别挑战赛(ImageNet Large Scale Visual Recognition Challenge,ILSVRC)是计算机视觉领域最重要的比赛之一,旨在推动图像识别技术的发展。该比赛提供了一个包含数百万张图像的大规模数据集,涵盖了数千个类别,参赛者需要开发算法来对图像进行分类、定位和检测。
在 2012 年之前,图像识别领域的进展相对缓慢,传统的机器学习方法在 ImageNet 数据集上的表现并不理想。然而,2012 年 AlexNet 的出现标志着深度学习在图像识别领域的突破,它以显著的优势赢得了当年的 ILSVRC 比赛,并开启了深度学习在计算机视觉领域的黄金时代。
1.2. AlexNet 的诞生与意义
AlexNet 由 Alex Krizhevsky、Ilya Sutskever 和 Geoffrey Hinton 共同开发,是卷积神经网络(Convolutional Neural Network,CNN)的一个经典模型。它的成功主要归功于以下几个因素:
- 深度架构: AlexNet 使用了 8 层的深度神经网络,相比于之前的浅层网络&#