TensorFlow基础与模型训练
1. 模型训练基础
在模型训练过程中,有几个关键的概念和操作。首先是损失函数的选择, sparse_categorical_crossentropy 和 categorical_crossentropy 都执行交叉熵操作,但前者直接接受真实标签作为输入,而后者要求真实标签提前进行one - hot编码。使用 sparse_categorical_crossentropy 可以避免手动转换标签。
在优化器方面,传递 'sgd' 给Keras等同于传递 tf.keras.optimizers.SGD() 。前者更易读,后者则可以指定自定义学习率等参数。损失函数、评估指标以及传递给Keras方法的大多数参数都遵循这个规则。
训练模型时,我们调用 .fit() 方法,它与另一个流行的机器学习库scikit - learn的接口非常相似。这里我们训练5个周期,即对整个训练数据集迭代5次。设置 verbose 为1,这样可以得到一个进度条,显示之前选择的评估指标、损失值和预计到达时间(ETA)。
模型性能方面,我们会发现模型存在过拟合现象,即训练准确率高于测试准确率。经过5个周期的训练,测试集准确率达到97%,比之前提高了约2%,但与最先进的算法99.79%的准确率仍有差距。
整个训练过程主要包括以下三个步骤:
1. 数据加载 :本次数据已可用,但在未来项目中,可
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



