深度学习在图像识别中的应用与优化
1. 理解深度学习的强大能力
为了更好地理解深度学习和卷积神经网络(ConvNet)的能力,我们可以进行一项测试:减少训练集的大小,并观察性能的相应衰减。具体做法是将包含 50,000 个样本的训练集划分为两个不同的集合:
- 用于训练模型的正式训练集,其大小逐步减少(分别为 5,900、3,000、1,800、600 和 300 个样本)。
- 用于评估模型训练效果的验证集,由剩余的样本组成。
测试集固定为 10,000 个样本。将定义的深度学习 ConvNet 与之前定义的简单神经网络进行比较,结果如下表所示:
| 训练样本数量 | 深度学习网络准确率 | 简单网络准确率 |
|---|---|---|
| 5,900 | 96.68% | 85.56% |
| 300 | 72.44% | 48.26% |
所有实验仅进行四次训练迭代。这证实了深度学习取得的突破性进展。从数学角度看,深度学习网络有更多的未知参数(权重),本应需要更多的数据点,但它通过保留空间信息、增加卷积、池化和特征图等创新,取得了更好的效果。截至 2017 年 1 月,MNIST 数据集的最佳结果误差率为 0.21%。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



