CUDA error: CUBLAS_STATUS_EXECUTION_FAILED 解决方法
最近在训练StructureNet的时候出现了一个错误:

这个错误是在反向传播 backward() 那一步出现的,网上搜了很多相关资料,大部分说法是CUDA 和 PyTorch 版本不匹配造成的,但是换了几个 CUDA 版本还是会出现同样的问题。
最后在GitHub上面看到一个Issue,其中有一个人这样子回复:

看来有可能是 PyTorch 的问题,由于模型比较老,担心新版本会出现其他问题,于是装了一个 PyTorch 1.7 成功运行!
这里还要注意一下 torch-scatter 的问题,我在直接 pip install torch-scatter 的时候出现报错,查了一下发现需要手动安装对应版本的 torch-scatter (参考:https://blog.youkuaiyun.com/dream__1/article/details/122433061)
在 https://pytorch-geometric.com/whl/ 找到对应版本的 torch-scatter,复制链接, pip install <link> 安装
在训练StructureNet时遇到CUDAerror:CUBLAS_STATUS_EXECUTION_FAILED错误,该问题可能由CUDA和PyTorch版本不匹配引起。尝试更新PyTorch到1.7版本成功解决问题。同时,安装torch-scatter时直接使用pip可能出现错误,需从https://pytorch-geometric.com/whl/找到对应版本手动安装。
8万+





