CNN图像分类模型（二）——AlexNet

最新推荐文章于 2025-05-22 09:53:47 发布

原创

最新推荐文章于 2025-05-22 09:53:47 发布 · 2.8k 阅读

14 ·

CC 4.0 BY-SA版权

文章标签：

#图像 #计算机视觉 #深度学习 #alexnet

本文详细介绍了AlexNet模型，该模型在2012年ImageNet竞赛中夺冠，推动了深度学习在图像分类领域的应用。文章涵盖了AlexNet的网络结构，包括5个卷积层和3个全连接层，以及ReLU、LRN和Dropout等关键技术，解释了它们的作用。此外，还讨论了数据增强在提高模型性能中的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

关于AlexNet模型论文，网上很多地方都可以下载到；我在学习的过程中，也看到SnailTyan把论文的翻译放在了个人博客中，也供大家学习参考：http://noahsnail.com/2017/07/04/2017-07-04-AlexNet论文翻译/

一）简介

Alex在2012年提出的AlexNet网络结构模型赢得了2012年ImageNet竞赛的冠军，使得CNN成为在图像分类上的核心算法，并引爆了神经网络的应用热潮。在此之后，更多的更深的神经网路被提出，比如优秀的VGG，GoogleLeNet等。同时，作者也强调了一点，在AlexNet模型中移除任何一个卷积层都会使得性能会降低，可见深度对模型精度非常重要。

二）AlexNet模型介绍

AlexNet网络结构

AlexNet模型共有8层（不包含输入层），5个卷积层和3个全连接层，每一个卷积层中包含了激励函数ReLU、局部响应归一化（LRN）处理，以及池化（下采样）。模型结构如下图所示。
在这里插入图片描述
论文中的结构之所以分为上下两部分，是因为当时显卡容量有限，无法在一张显卡上操作网络中60M的网络参数，作者不得不在两张显卡上分别运算，并在特定的网络层进行交互。为了更方便的理解，我们可以假设全部在一块GPU计算，从稍微简化点的方向来分析这个网络结构。