使用 VGG16 实现图像识别分类及VGG 19 实现艺术风格转移
一、VGG 简介
1.1 网络架构
- 训练输入: 固定尺寸224*224的RGB图像。
- 预处理:每个像素值减去训练集上的RGB均值。
- 卷积核:一系列3*3卷积核堆叠, 步长为1, 采用padding保持卷积后图像空
间分辨率不变。 - 空间池化:紧随卷积“堆”的最大池化,为2*2滑动窗口, 步长为2。
- 全连接层: 特征提取完成后,接三个全连接层, 前两个为4096通道, 第三个
为1000通道, 最后是一个soft-max层, 输出概率。 - 所有隐藏层都用非线性修正ReLu
- 下图是论文中提到的一些网络的架构
- 关于,本文实验代码,以及训练好的 VGG 参数均可以在此处下载: