文章信息
题目:VGGNet:VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION (ICLR2015)
原文:https://paperswithcode.com/paper/very-deep-convolutional-networks-for-large
数据集:ILSVRC 2012
一、简述
这篇文章是以比赛为目的——解决ImageNet中的1000类图像分类和 localization。作者团队对当时的卷积网络进行改进(仅改变深度),即通过固定除深度以外的参数和对网络的每个层加入3×3的卷积滤波器来增加网络层数(改变深度)。本文提出16和19层的VGGNet效果最好,即VGG16、VGG19。VGG网络是传统卷积网络在深度上所能达到的极致。
二、网络模块
下图每一列都是一个模型,本文提出6个网络模型,命名为A、A-LRN、B、C、D、E。其中模型D和E就是所说的VGG16和VGG19。每一个模型都分为5个block,且卷积核都为3×3大小,随着模型变深,卷积核大小不变,但个数增加,通道数也会相应修改。如网络A,block1中卷积核大小3,个数64,在block2中卷积核大小不变,个数翻倍128个,在block3中卷积核大小不变,个数在block的基础上又翻倍变成256个,同时卷积层数从1层变成了2层。A-LRN表示在网络A的基础上加入了LRN层,但在VGG中对A加入LRN层作用不大。
输入3通道的224×224的RGB彩色图像,经过VGG网络的处理,得到1000个类别的后验概率ÿ