论文名称:ImageNet Classification with Deep Convolutional Neural Networks
论文地址:http://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf
AlexNet训练了一个更深的卷积神经网络,一共8层,5个卷积层+3个全连接层,使用ReLU非线性激活单元使得训练速度更快,提出局部响应归一化(Local Response Normalization)提高模型泛化能力,使用数据增强(Data Augmentation)和dropout减少过拟合,在ImageNet大型视觉识别挑战赛(ILSVRC)上取得了更高的精确度。
一、论文解读
1、ImageNet
ImageNet是一个有超过1500万个标记的高分辨率图像的数据集,大约有22000个类别。从2010年开始,每年都会举行一次名为ImageNet大型视觉识别挑战赛(ILSVRC)的比赛。ILSVRC使用ImageNet的一个子集,在1000个类别中,每个类别中大约有1000个图像。总共大约有120万个训练图像、50000个验证图像和150000个测试图像。ImageNet由可变分辨率的图像组成,而我们的系统需要恒定的输入维度。因此,将采样图像降低到256×256的固定分辨率。对于矩形图像,首先对图像进行重新缩放,使较短的一侧长度为256,然后从生成的图像中裁剪出中心256×256patch。除了从每个像素中减去训练集