Visual Geometry Group 视觉几何组
VGGNet网络证明了增加网络深度有利于分类精度,使错误率下降。VGGNet模型应用到其它图像数据集上泛化性也很好。
(1).结构简洁:卷积层+ReLU、最大池化层、全连接层、Softmax输出层。
(2).使用连续几个较小卷积核(3*3)替换AlexNet中的较大卷积核且采用same padding(即p=(f-1)/2),既减少参数,又进行了更多的非线性映射,可以增加网络的拟合能力。分为5段卷积,每段包括2至4卷积层。
(3).最大池化,小池化核(2*2),stride为2。
(4).通道数即feature maps数逐渐翻倍增加,使得更多的信息可以被提取出来。
(5).训练时将同一张图像缩放到不同的大小,在随机裁剪到224*224大小以及随机水平翻转,增加训练数据量。
(6).在测试阶段,将3个全连接层替换为3个卷积层,这样输入层可以接收任意宽或高的图像。
VGG-16(13个卷积层+3个全连接层)与VGG-19(16个卷积层+3个全连接层)的区别:
(1).VGG-16:2个卷积层+Max Pooling+2个卷积层+Max Pooling+3个卷积层+Max Pooling+3个卷积层+Max Pooling+3个卷积层+Max Pooling+3个全连接层。
VGGNet由VisualGeometryGroup提出,其特点是网络深度增加,使用小尺寸卷积核和相同填充,通过多层非线性映射提升分类精度。网络结构包括卷积层、ReLU、最大池化层和全连接层。训练策略包括图像缩放、随机裁剪和水平翻转。VGG-16和VGG-19的区别在于卷积层的数量。这种设计增强了模型的泛化性能。
1633

被折叠的 条评论
为什么被折叠?



