VGGNet：very deep convolutional networks for large-scale image recognition LCLR2015

原创

已于 2024-01-18 23:56:52 修改 · 749 阅读

9 ·

CC 4.0 BY-SA版权

文章标签：

#计算机视觉 #python #图像处理 #目标检测

于 2024-01-18 23:51:51 首次发布

文章信息
题目：VGGNet：VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION (ICLR2015)
原文：https://paperswithcode.com/paper/very-deep-convolutional-networks-for-large
数据集：ILSVRC 2012
一、简述
这篇文章是以比赛为目的——解决ImageNet中的1000类图像分类和 localization。作者团队对当时的卷积网络进行改进（仅改变深度），即通过固定除深度以外的参数和对网络的每个层加入3×3的卷积滤波器来增加网络层数（改变深度）。本文提出16和19层的VGGNet效果最好，即VGG16、VGG19。VGG网络是传统卷积网络在深度上所能达到的极致。

二、网络模块
下图每一列都是一个模型，本文提出6个网络模型，命名为A、A-LRN、B、C、D、E。其中模型D和E就是所说的VGG16和VGG19。每一个模型都分为5个block，且卷积核都为3×3大小，随着模型变深，卷积核大小不变，但个数增加，通道数也会相应修改。如网络A，block1中卷积核大小3，个数64，在block2中卷积核大小不变，个数翻倍128个，在block3中卷积核大小不变，个数在block的基础上又翻倍变成256个，同时卷积层数从1层变成了2层。A-LRN表示在网络A的基础上加入了LRN层，但在VGG中对A加入LRN层作用不大。
输入3通道的224×224的RGB彩色图像，经过VGG网络的处理，得到1000个类别的后验概率，softmax将这1000个后验概率归一化，选择其中最大的概率作为图像预测的结果。实验表明VGG16和VGG19网络效果最好。
在这里插入图片描述

最低0.47元/天解锁文章