GPU加速:
把计算过程从CPU切换到GPU上。首先,把设备定义为使用cuda,然后把我们建立好的网络MLP搬到设备上去,还需要把交叉熵损失函数也搬上去,最后需要把data搬上去。,即完成了数据上传至cuda进行加速运算的前期准备。
网络刚开始训练时,loss会下降,准确性会上升,这时的网络参数在学一些本质的特征,但随着学习的次数增加,会发现尽管准确率上升,但有效性却不再上升,并且损失函数还会偶尔剧烈波动。这是因为后面网络参数不再学医本质东西了,而是开始抄袭数据,使之变得无效。因此网络并不是训练越久越好。
计算正确率:
即预测对的概率
- 首先,建立一个4*10的张量,表示4张图片,每个图片可能有10个结果,作为假设的输出结果。
- 然后利用softmax函数进行归一化,发现size并不会因为归一化而变化。
- 然后利用argmax函数提取向量中最大的元素的位置,作为预测标签。
- 输出预测标签为[9,5,9,4],即预测手写数字的值。