论文阅读笔记：VGG：Very Deep Convolutional Networks

最新推荐文章于 2024-02-29 20:48:13 发布

ProYH

最新推荐文章于 2024-02-29 20:48:13 发布

阅读量581

点赞数 3

CC 4.0 BY-SA版权

分类专栏： Deep-Learning 基础论文文章标签： VGG 深度学习分类基础网络

本文链接：https://blog.youkuaiyun.com/u010579901/article/details/79184464

Deep-Learning 基础论文专栏收录该内容

13 篇文章

订阅专栏

VGG网络由牛津大学视觉几何组提出，通过堆叠小型3x3卷积核和2x2最大池化层，构建了16~19层深的卷积神经网络。相较于AlexNet，VGG使用更小的滤波器并引入1x1卷积核进行降维，减少了计算量，增强了网络表达能力。在网络结构方面，VGG采用了多个连续3x3卷积核代替单一的大尺寸卷积核，增加了非线性处理，提高了学习能力。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文阅读笔记：VGG：Very Deep Convolutional Networks

论文下载地址：Very Deep Convolutional Networks for Large-Scale Image Recognition

本文主要包含如下内容：

论文阅读笔记VGGVery Deep Convolutional Networks

论文来源于牛津大学 visual geometry group（VGG），撰写于2014年，主要探讨了深度对网络的重要性，并且构造了一个19层的深度神经网络，在ILSVRC 2014中定位获得了第一名，分类获得了第二名。

主要思想

这篇论文的工作在ILSVRC 2014中的classification项目的比赛中取得了第2名的成绩，证明网络越深，网络学习能力越好，分类能力越强。

相对于 Alex-net，论文主要使用了较小尺寸的滤波器，并且使用 1*1 卷积核进行降为操作，在减少计算量的同时引入了非线性，增强了网络的表达能力。

网络结构

VGGNet 网络结构通过反复堆叠3´3的小型卷积核和2´2的最大池化层，成功地构筑了16~19层深的卷积神经网络。

其中，网络中使用了3*3卷积核：未使用较大的感受野，如11*11和7*7的卷积核，因为两个连续的3*3大小的卷积核与一个5*5大小的卷积核具有相同的局部空间(感受野)，而连续的3*3大小的卷积核则和一个7*7大小的卷积核具有相同的局部空间。但相比使用一个7*7大小的卷积核，3个连续的3*3的卷积核进行了3次非线性处理，提高了网络的学习能力。另外，3*3的卷积核也降低了参数的数目，假设3x3的卷积核处理C通道的feature maps时，一共有3（3x3xCxC）=27CxC个参数，而7x7的卷积核则有7x7xCxC共49CxC个参数；