深度学习入门day5

原创已于 2025-07-03 20:47:00 修改 · 213 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #人工智能

于 2025-07-03 20:31:06 首次发布

深度学习专栏收录该内容

9 篇文章

订阅专栏

一、网络结构

续接上一章内容，我们可以输出神经网络各层权重的形状。然后绘制出大概的示例图

print(x.shape)
print(x[0].shape)
print(W1.shape)
print(W2.shape)
print(W3.shape)

显然X是包含1w个图片的Numpy数组，不过每次只处理一张图片。

只输入一张图片时。整体流程是这样的，输入一个由784个元素（原来是28×28）构成的一维数组后，输出一个有10个元素的一维数组。
考虑打包输入多个图像的情况。假设，使用predict()函数一次性打包处理100张图片，可以把输入数据的形状改成100×784。而输出数据的形状将会是100×10。这说明100张图片的结果被一次性输出了。

需要修改的代码部分如下

batch_size=100#批量数
for i in range(0,len(x),batch_size):
    x_batch=x[i:i+batch_size]
    y_batch=predict(network,x_batch)
    p=np.argmax(y_batch,axis=1)
    accuracy_cnt+=np.sum(p==t[i:i+batch_size])
print("Accuracy:" + str(float(accuracy_cnt) / len(x)))

>>>list(range(0,500,100))

[0,100,200,300,400]

argmax()获取值最大的元素的索引，这里指定axis=1，也就是指定在该100×10的数组中，沿行方向，找到值最大的元素的索引。
p和t[i:i+bacth_size]相当于两个同形的Numpy数组相应位置上一一对比，若预测结果和标签一样，则cnt加一，一次性可以比较100个。