本节将首先给出一个神经网络示例,引出如下概念。了解完本节后,可以对神经网络在代码上的实现有一个整体的了解。
本节相关概念:
- 类
- 样本
- 标签
- 层(layer)
- 数据蒸馏
- 密集连接
- 10路softmax分类层
- 编译(compilation)步骤的3个参数
- 损失值、精度
- 过拟合
我们来看一个神经网络的具体实例:使用Python的Keras库来学习手写数字分类。
在这个例子中,我们要解决的问题是,将手写数字的灰度图像(28像素×28像素)划分到10个类别中(从0到9)。我们将使用MNIST数据集。你可以将“解决”MNIST问题看作深度学习的“Hello World”,用来验证你的算法正在按预期运行。下图给出了MNIST数据集的一些样本。
说明
在机器学习中,分类问题中的
某个类别叫作类(class
),数据点叫作样本(sample)
,与某个样本对应的类叫作标签(label)
(即描述:样本属于哪个类别)。
你不需要现在就尝试在计算机上运行这个例子。之后的文章会具体分析。
一. 训练Keras中的MNIST数据集
from tensorflow.keras.datasets import mnist
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()
train_images和train_labels组成了训练集,模型将从这些数据中进行学习。然后,我们在测试集(包括test_images和test_labels)上对模型进行测试。
图像被编码为NumPy数组,而标签是一个数字数组,取值范围是0~9。图像和标签一一对应。
看一下训练数据:
>>> train_images.shape
(60000, 28, 28)
>>> len(train_labels)
60000
>>> train_labels
array([5, 0, 4, ..., 5, 6, 8], dtype=uint8)
再来看一下测试数据:
>>> test_images.shape