基于VGG-16和VGG-19的疾病图像分类模型研究
1. VGG网络架构介绍
1.1 VGG-16架构
VGG-16的架构包含一系列卷积层、池化层和全连接层,具体如下:
1. 进行64个滤波器的卷积操作。
2. 64个滤波器的卷积操作 + 最大池化(步长2x2,大小2)。
3. 128个滤波器的卷积操作。
4. 128个滤波器的卷积操作 + 最大池化(步长2x2,大小2)。
5. 256个滤波器的卷积操作(重复3次) + 最大池化(步长2x2,大小2)。
6. 512个滤波器的卷积操作(重复3次) + 最大池化(步长2x2,大小2)。
7. 512个滤波器的卷积操作(重复3次) + 最大池化(步长2x2,大小2)。
8. 全连接层,包含4096个节点(重复2次)。
9. 输出层,使用Softmax激活函数,包含1000个节点。
隐藏层使用ReLU激活函数,部分网络包含局部响应归一化(LRN),但这种归一化对训练数据集的性能提升不大,还可能增加内存消耗和计算时间。
1.2 VGG-19架构
VGG-19是VGG-16的改进版本,在VGG-16的基础上增加了3个卷积层,因此共有19个卷积层。它同样以224x224的RGB图像作为输入,矩阵形状为(224, 224, 3)。在预处理阶段,会从每个像素中减去RGB值。其具体层结构如下:
1. Conv3x3(64)(重复2次) + MaxPool
2. Conv3x3(128)(重复2次) + MaxPool
3. Conv3x3(256)(重复4次) + MaxPool
超级会员免费看
订阅专栏 解锁全文
2850

被折叠的 条评论
为什么被折叠?



