- 博客(1)
- 收藏
- 关注
原创 RuntimeError: one of the variables needed for gradient computation has been modify的解决方法之一
摘要:文章分析了一个PyTorch反向传播错误(RuntimeError),指出问题源于同一计算图中的张量被多次修改。通过实验发现,当policy网络和qf网络共享evader_action张量时,qf_loss.backward()会错误地更新policy网络参数。解决方案是在计算qf_loss前,使用.detach()将evader_action从原计算图中分离,避免反向传播时影响policy网络。同时强调,类似情况中,作为常数的target_Q若由网络生成也需进行.detach()处理。该解决方法成功
2025-07-21 16:55:48
371
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅