VGG-16
Karen Simonyan 在《Very Deep Convolutional Networks for Large-scale Image Recognition》中讨论了卷积网络的深度对其在大规模图像识别的准确性的影响。作者比较了5中不同深度的卷积网络,其中深度为16的网络——VGG-16成为一种经典的网络架构。许多网络都是在VGG-16的基础上删除和添加其他层。
VGG-16 Architecture
这里只介绍VGG-16的架构,这是用的最多的一种网络,论文中的其它4个就不介绍了。
VGG-16的网络很简单,有13个卷积层(被5个max-pooling层分割)和3个全连接层。所有卷积层的过滤器大小都是3×33×3,步长为1,进行padding。作者设置所有卷积层的过滤器大小都为3×33×3是有原因的,因为过滤器尺度更大的卷积层可以使用多个3×33×3卷积层来达到同样的效果,比如2个连在一起的3×33×3卷积层(步长为1)的接收域与5×55×5的卷积层的接收域一样。作者还给出了更多的解释,首先,使用多个