1.LSTM报错:RuntimeError: Trying to backward through the graph a second time, but the saved intermediate results have already been freed. Specify retain_graph=True when calling backward the first time.
LSTM由于需要保存上一次的隐藏层信息,而backward之后这些信息会丢失,进而出现上述报错。解决方案可参考:https://blog.youkuaiyun.com/a845717607/article/details/104598278/
2.模型开始测试之前,需要model.eval(),防止测试过程中权重发生变化。
本文介绍了LSTM训练中常见的报错问题及解决方案,特别是关于backward操作导致的隐藏层信息丢失错误,并提醒在模型测试前要调用model.eval()以避免权重更新。
8042

被折叠的 条评论
为什么被折叠?



