Gary761203-优快云博客

原创 RuntimeError: one of the variables needed for gradient computation has been modify的解决方法之一

摘要：文章分析了一个PyTorch反向传播错误(RuntimeError)，指出问题源于同一计算图中的张量被多次修改。通过实验发现，当policy网络和qf网络共享evader_action张量时，qf_loss.backward()会错误地更新policy网络参数。解决方案是在计算qf_loss前，使用.detach()将evader_action从原计算图中分离，避免反向传播时影响policy网络。同时强调，类似情况中，作为常数的target_Q若由网络生成也需进行.detach()处理。该解决方法成功

2025-07-21 16:55:48 371 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人