
其中,input_size(输入张量x的维度)=6,hidden_size(隐藏层的维度, 隐藏层的神经元个数)=6,num_layer(隐藏层层数)=2

train loss与test loss结果分析:
train loss 不断下降,test loss不断下降,说明网络仍在学习;
train loss 不断下降,test loss趋于不变,说明网络过拟合;
train loss 趋于不变,test loss不断下降,说明数据集100%有问题;
train loss 趋于不变,test loss趋于不变,说明学习遇到瓶颈,需要减小学习率或批量数目;
train loss 不断上升,test loss不断上升,说明网络结构设计不当,训练超参数设置不当,数据集经过清洗等问题。
博客介绍了LSTM网络中输入张量维度、隐藏层维度和隐藏层层数的设置,重点分析了train loss与test loss的不同变化情况。如两者都下降表示网络在学习,train loss降而test loss不变则是过拟合等,为网络训练提供参考。
3213

被折叠的 条评论
为什么被折叠?



