最近决定精度一下经典CNN网络,很多都是一直用封装的又比较好所以泛读的较多。这是第一篇大名鼎鼎的VGG
论文连接:https://arxiv.org/abs/1409.1556
摘要
主要贡献:使用(3*3)小卷积核,对网络深度的增加进行全面评估,增加网络层数到16或19层,网络表现出了一个显著的效果提升。在ImageNet2014挑战中,检测和分类任务中各自取得了第一和第二的成绩。
1 引言
近来卷积网络已经在大规模图片和视频识别方向上取得了很大的成功,高性能的计算体系,如GPU或大规模分布式的使用。基于ImageNet的大规模视觉识别竞赛在深度视觉识别领域中成为了一个重要的角色,它为使用深度网络提取高维隐藏特征进行大规模图像分类的模型提供了一个可靠的测试集。
在卷积网络在计算机视觉领域成为一种通用结构时,大量的研究致力于微调AlexNet的结构来提升准确率。在本文中,我们着重于另一个卷积网络架构设计中的要点—深度。我们固定了网络架构中的其他参数,通过增加卷积层来平稳的增加网络深度。由于小卷积核(3*3)的使用,这种方法(不断增加网络深度)得以实现。