VGG卷积神经网络
一.背景
ILSVRC 2014的第二名是Karen Simonyan和 Andrew Zisserman实现的卷积神经网络,现在称其为VGGNet。它主要的贡献是展示出网络的深度是算法优良性能的关键部分。
他们最好的网络包含了16个卷积/全连接层。网络的结构非常一致,从头到尾全部使用的是3x3的卷积和2x2的汇聚。他们的预训练模型是可以在网络上获得并在Caffe中使用的。
VGGNet不好的一点是它耗费更多计算资源,并且使用了更多的参数,导致更多的内存占用(140M)。其中绝大多数的参数都是来自于第一个全连接层。
后来发现这些全连接层即使被去除,对于性能也没有什么影响,这样就显著降低了参数数量。
目前使用比较多的网络结构主要有ResNet(152-1000层),GooleNet(22层),VGGNet(19层)。大多数模型都是基于这几个模型上改进,采用新的优化算法,多模型融合等,这里重点介绍VGG。
(图片来自网络)
二.简介
模型的名称——“VGG”代表了牛津大学的Oxford Visual Geometry Group,该小组隶属于1985年成立的Robotics Research Group,该Group研究范围包括了机器学习到移动机器人。下面是一段来自网络对同年GoogLeNet和VGG的描述:
“GoogLeNet和V
VGGNet是由Karen Simonyan和Andrew Zisserman在ILSVRC 2014中提出的,它展示了网络深度对性能的重要性。VGG的特点包括:全使用3x3小卷积核,连续的卷积层,2x2小池化核,更多的通道数,更深的网络层次,以及在测试阶段全连接层转为卷积。尽管计算量大,但通过堆叠小卷积核,VGG能有效捕捉图像特征并提高模型精度。
订阅专栏 解锁全文
2082

被折叠的 条评论
为什么被折叠?



