1. 残差网络分类问题
非常深的神经网络是很难训练的,因为存在梯度消失和梯度爆炸问题
根据 深度学习笔记(28) 残差网络 可以了解到
可以利用跳跃连接构建能够训练深度网络的ResNets
那么,还是以MNIST手写数字识别问题为例,采用ResNets模型来解决问题
以下有部分内容与 TensorFlow笔记(7) 多神经元分类 重复,如数据读取等可选择性跳过
2. 数据读取
利用网上的 MNIST 数据集 获取数据集压缩文件(切勿解压):
压缩文件 | 说明 |
---|---|
train-images-i |