问题描述
conda clone一个环境后, import torch的时候报错:
torch/lib/libc10_cuda.so: undefined symbol: cudaMemPoolSetAttribute, version libcudart.so.11.0
解决办法
首先找到libcudart.so.11.0的位置, 发现在ENV/lib/libcudart.so.11.0里,

和原始环境的so文件不一致, so连接在clone的时候出错了

修改回去就可以,
unlink libcudart.so.11.0
ln -s libcudart.so.11.8.89 libcudart.so.11.0
同理对libcusparse.so.11也修改下连接
unlink libcusparse.so.11
ln -s libcusparse.so.11.7.5.86 libcusparse.so.11
之后就能import torch了

在conda克隆环境后遇到导入torch时的错误,原因是libcudart.so.11.0和libcusparse.so.11的链接不正确。解决方法是找到正确的so文件版本并创建软链接,如将libcudart.so.11.8.89链接为libcudart.so.11.0,将libcusparse.so.11.7.5.86链接为libcusparse.so.11。
1726

被折叠的 条评论
为什么被折叠?



