问题描述:对于神经网络,在训练集上已经收敛,而测试集上的误差始终维持在一个很大的值,自始至终都不下降;
可能存在的原因分析:
-
欠拟合
首先排除欠拟合,因为网络在训练集上已经收敛 -
过拟合
如果出现过拟合,应该是训练 loss 曲线一直下降,而测试 loss 是先下降后上升,排除 -
训练和测试的输入不同
测试集和训练集采用完全相同的预处理方式,排除 -
使用收敛的网络对训练集进行测试,发现结果正常,说明模型的保存、网络测试部分的搭建没有问题
问题描述:对于神经网络,在训练集上已经收敛,而测试集上的误差始终维持在一个很大的值,自始至终都不下降;
可能存在的原因分析:
欠拟合
首先排除欠拟合,因为网络在训练集上已经收敛
过拟合
如果出现过拟合,应该是训练 loss 曲线一直下降,而测试 loss 是先下降后上升,排除
训练和测试的输入不同
测试集和训练集采用完全相同的预处理方式,排除
使用收敛的网络对训练集进行测试,发现结果正常,说明模型的保存、网络测试部分的搭建没有问题