本文对TensorFlow官方示例-手写数字识别教程的读书笔记。
教程分为3个部分:
- 数据准备
- 模型建立
- 模型评价
1.数据准备
教程使用的是公开的MNIST手写数字图片记,并且对数据的访问进行了封装,因此在实际编码过程中很方便的就可以将数据准备好。
这里需要注意的是,数据集中保存的并不是真正的一张张真实的图片,而是用矩阵对数据进行了展示。比如,训练记中的数据表示为:
它是一个55000×784维的张量,表示有55000张图片,每张图片用784维的一维向量表示。
2.模型建立
本教程使用的模型可以直观的表示为:
x 是向量形式的图片,
用公式表示为:
y=softmax(Wx+b)
损失函数定义为:
Hy′(y)=−∑iy′ilog(y