1.VGGNet概述:
VGGNet在AlexNet基础上创建了更深层的网络,与GoogLeNet一起在2014年image net竞赛中表现出色。VGGNet和GoogLeNet一起进一步提升了深度学习在图像领域的表现。VGGNet证明了在一定程度上随着网络的加深,网络的能力也有明显的提高。
2.VGGNet网络结构
VGGNet网络中提供了多种网络结构,A-E的网络结构是基本一致的,最大的区别在于结构中卷积核的数量和大小不同,目前普遍使用的是D,E两种结构,即为人熟知的VGG16和VGG19。
以VGG16为例:
input图像输入为224*224*3
第一层结构:3*3*64串联3*3*64串联maxpooling。此层结构采用了3*3的卷积核进行串联,这个串联结构是VGG的首创,并且取得了非常不错的结果。
第二层结构:3*3*128串联3*3*128串联maxpooling。
第三层结构:3*3*256串联三次,再串联maxpooling
第四层结构:3*3*512串联三次,再串联maxpooling
第五层结构:3*3*512串联三次,再串联maxpooling
最后:两层FC全链接,利用softmax输出。
VGG结构的主要特点:
1.用小的卷积核串联替代大的卷积核:
例如用两个3*3的卷积核串联可以替代一个5*5的卷积核,用3个3*3的卷积核串联可以替代一个7*7的卷积核。如图所示,两个串联的3*3卷积核感受野和单独的5*5卷积核完全一样。
用小卷积核串联的方法替代大卷积核有什么优势呢:
(1)增加了非线性函数,增强网络的判别力。对于一个大的卷积核来说只有一个非线性激活函数,但是对于多个小卷积核的串联,可以经过多个非线性激活函数。因此,模型能够抽取得到更具有表达力的特征。
(2)减少卷积参数。对于一个(C,H,W)的图片,7*7的卷积核需要参数数量为
2.递增的通道数。
受到AlexNet的启发,VGGNet采用了输出的feature map通道递增的方法,层数越深输出通道数越多。这样特征维度越高,能够获得的特征类型越丰富。
3.最后一层采用全卷积替换全连接。
使用1*1的卷积替代全连接网络,这样做可以接收任意宽高图片作为输入。
4.实验证明了LRN的无用