深度神经网络分类性能的紧凑可视化:解释与改进
1. 实验方案
为了展示所提方法的效率,我们设置了多个依赖测试数据集和训练好的网络的场景。下面介绍这些数据集和网络。
1.1 数据集
- MNIST :这是手写数字识别的标准数据集,包含 28×28 的灰度图像。即使简单的网络也能在这个 10 类数据集上表现出色,可用于说明对简单数据的分类情况。
- Fashion - MNIST :与 MNIST 分布相似,但由服装图像而非数字组成。其分类性能通常低于 MNIST,更接近现实世界的分类问题,用于说明对中等难度数据集的分类。
两个数据集都有 60000 个样本用于训练模型,10000 个样本用于评估。
1.2 网络
我们在评估中使用了以下三种网络:
- LeNet5 :一个简单且较旧的卷积神经网络(CNN),在 MNIST 上能取得良好的准确率。其拓扑结构简单,便于理解数据在模型中的转换过程。不过,由于参数较少,在更复杂的识别任务中准确率较低。
- DoubleLeNet5 :这是我们创建的一个嵌合网络,用于展示系统处理多分支网络的能力。它由两个去掉预测层的 LeNet5 组成,并行处理相同的输入数据,但其中一个分支在卷积层处理前会进行图像旋转操作。两个分支在输入预测层之前会进行拼接。该模型在性能上与 LeNet5 针对相同类型的数据,有轻微的性能提升。
- VGG16
超级会员免费看
订阅专栏 解锁全文
2874

被折叠的 条评论
为什么被折叠?



