图像分类CNN经典网络(一)AlexNet与VGG

本文深入解析了CNN领域的两个经典网络模型:AlexNet与VGGNet。AlexNet作为首个成功应用卷积神经网络于图像分类的模型,引入了ReLU、重叠池化、LRN和Dropout等技术。而VGGNet则通过堆叠小卷积核,构建了深度达16~19层的网络,展示了深度与性能的关系。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本篇文章总结了CNN领域用于图像分类的两个网络AlexNet与VGGNet。

在图像分类领域,CNN有了很好的应用,下图展示了2012年之后的一些经典的网络架构。
在这里插入图片描述

AlexNet

AlexNet是打开卷积神经网络大门的第一个作品,它重新将卷积神经网络带入计算机视觉的科研中。他给出了卷积神经网络在目标检测中的基本思想。
注意要特点又
1、ReLU、双GPU运算:提高训练速度。(应用于所有卷积层和全连接层)
2、重叠pool池化层:提高精度,不容易产生过度拟合。(应用在第一层,第二层,第五层后面)
3、局部响应归一化层(LRN):提高精度。(应用在第一层和第二层后面)
4、Dropout:减少过度拟合。(应用在前两个全连接层)
在这里插入图片描述

VGGNet

VGGNet由牛津大学计算机视觉组合和Google DeepMind公司研究员一起研发的深度卷积神经网络。它探索了卷积神经网络的深度和其性能之间的关系,通过反复的堆叠33的小型卷积核和22的最大池化层,成功的构建了16~19层深的卷积神经网络。VGGNet获得了ILSVRC 2014年比赛的亚军和定位项目的冠军,在top5上的错误率为7.5%。

VGGNet的网络结构如下图所示。VGGNet包含很多级别的网络,深度从11层到19层不等,比较常用的是VGGNet-16和VGGNet-19。VGGNet把网络分成了5段,每段都把多个3*3的卷积网络串联在一起,每段卷积后面接一个最大池化层,最后面是3个全连接层和一个softmax层。

在这里插入图片描述
我们以VGG16做一个分析
下图给出了VGG16的一个内存占用和参数量的分析。
在这里插入图片描述

VGG特点总结如下:

1、至今,VGGNet仍然是现如今搭建基本的CNN网络的基本网络,很多网络构建初期都是在VGG的基础上搭建。
2、网络在创新上提出了用小的卷积核代替大卷积的思想。用两个3*3的卷积核去替代5*5的卷积核,用三个3*3的卷积核代替7*7的卷积核。
如何理解?
可以看下图原来一个55的区域要用一个核卷积,如今先用个33的核来卷积得到第二层的图,图纸考虑是步长为1的情况,此时最底层移动三次可以把5*5的区域遍历到,然后得到第二层3*3的图。然后再用3*3的核对第二层卷积得到顶层一个。这样就达到用用两个3*3的卷积核去替代5*5的卷积核。很巧妙!!
在这里插入图片描述
使用尺寸小的卷积的好处?
(1)更少的参数量;
(2)更多的非线性变换,使得CNN对特征的学习能力更强表达能力增强;
(3)隐式的正则化效果(收敛速度要快)。

参考文献

[1]AlexNet详细解读
https://blog.youkuaiyun.com/qq_24695385/article/details/80368618
[2]VGGNet介绍
https://blog.youkuaiyun.com/u013181595/article/details/80974210
[3]卷积神经网络的网络结构——VGGNet
https://www.imooc.com/article/34700
[4]大话CNN经典模型:
https://my.oschina.net/u/876354/blog/1634322

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值