AssertionError: Torch not compiled with CUDA enabled
先介绍下版本:cuda-11.4
然后我这里的问题是出在没有下载对应cuda版本的pytorch。在pytorch官网找到了对应的命令,但是在虚拟环境里使用conda命令下载后,torch.cuda.is_available()输出的仍然是False。然后更换了pip下载,问题就解决了。。。
正确命令:
pip install torch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1
RuntimeError: CUDA error: no kernel image is available for execution on the device
在跑MOT模型时遇到的常见问题,基本都需要重新下载pytorch。
我的机器是CUDA11.4,直接官网使用命令下载对应版本的pytorch就好了。
conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch
python3.6版本问题
- 问题:
anaconda3/envs/decomp/lib/python3.6/site-packages/torch/lib/libtorch_python.so: undefined symbol: PySlice_Unpack
- 解决:环境的pytorch是1.4.0,和Python3.6.0冲突,需要将Python升级到3.6.2。
conda install python==3.6.2
编译过程中出现cannot fine -l*** 的错误
/usr/bin/ld: cannot find -ltensorflow_framework
collect2: error: ld returned 1 exit status
参考了一下github上的几个issue:
情况1):如果是TensorFlow1.14,那可能tensorflow_framework的包名字不对,需要去对应路径下检查,参考:https://blog.youkuaiyun.com/u012947309/article/details/116736684
情况2):也就是我自己的情况,我的tensorflow版本是1.15.0,降级到1.4.0就work了~~
深度学习更改网路结构的时候 直接赋值tensor会造成无法提梯度回传 需要使用.clone()方法
具体参考: https://blog.youkuaiyun.com/qq_45512728/article/details/124010479