一、网络结构
续接上一章内容,我们可以输出神经网络各层权重的形状。然后绘制出大概的示例图
print(x.shape)
print(x[0].shape)
print(W1.shape)
print(W2.shape)
print(W3.shape)
显然X是包含1w个图片的Numpy数组,不过每次只处理一张图片。
- 只输入一张图片时。整体流程是这样的,输入一个由784个元素(原来是28×28)构成的一维数组后,输出一个有10个元素的一维数组。
- 考虑打包输入多个图像的情况。假设,使用predict()函数一次性打包处理100张图片,可以把输入数据的形状改成100×784。而输出数据的形状将会是100×10。这说明100张图片的结果被一次性输出了。
需要修改的代码部分如下
batch_size=100#批量数
for i in range(0,len(x),batch_size):
x_batch=x[i:i+batch_size]
y_batch=predict(network,x_batch)
p=np.argmax(y_batch,axis=1)
accuracy_cnt+=np.sum(p==t[i:i+batch_size])
print("Accuracy:" + str(float(accuracy_cnt) / len(x)))
- >>>list(range(0,500,100))
[0,100,200,300,400]
- argmax()获取值最大的元素的索引,这里指定axis=1,也就是指定在该100×10的数组中,沿行方向,找到值最大的元素的索引。
- p和t[i:i+bacth_size]相当于两个同形的Numpy数组相应位置上一一对比,若预测结果和标签一样,则cnt加一,一次性可以比较100个。