
Cuda
东方小烈
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
NVIDIA NVML Driver/library version mismatch
如果安装完了Cuda和Nvidia驱动遇到这种问题,nvidia-smi命令出现了NVIDIA NVML Driver/library version mismatch的错误,需要检查Nvidia驱动的版本,查看是否匹配。输入命令如下:ubuntu-drivers devices会显示:driver : nvidia-driver-418-server - distro non-freedriver : nvidia-driver-440-server - distro non..原创 2020-08-04 21:06:57 · 1392 阅读 · 0 评论 -
PyTorch or TensorFlow : cuDNN error: CUDNN_STATUS_EXECUTION_FAILED, Cuda
很多时候这个错误都以为是Cuda安装的问题。其实并非全部如此,有一部分原因是你的GPU显存被占用光了,再运行就出错了。我就遇到过,rnn(embedded),使用LSTM/GRU处理Embedding后的序列,为何会出现这个问题。建议nvidia-smi查询一下GPU的使用情况,Kill -9 掉部分程序。尤其是使用Jupyter Lab运行的,没有即使释放显存,会出现这个问题。...原创 2020-07-24 14:42:41 · 1254 阅读 · 1 评论 -
MXNet的初体验,MXNet的快速安装
刚好需要用到MXNet的模型,MXNet和TensorFlow一样,具有GPU和CPU版本。如果直接pip install mxnet调用GPU时,就会出错,直接程序关掉。或者出现"dmlcx xxxxx"一大堆的问题。现在各大深度学习框架,出了Caffe和PyTorch,基本上能够实现pip install 非常方便。首先查一下本服务器的Cuda环境,命令如下nvcc --versionnvcc: NVIDIA (R) Cuda compiler driverCopyright (c) .原创 2020-07-15 09:39:09 · 468 阅读 · 0 评论 -
PyTorch CUDA runtime error (59) : device-side assert triggered
出现这个问题原因很多,尤其是使用Jupyter时,一般而言,都是代码出错,或者多次运行。检查输入和模型是否批评。例如在运行BertModel时,如果num_labels指定错了,和你输入不匹配,就会造成这种问题。bert_config = BertConfig(vocab_size_or_config_json_file=30522, ...原创 2019-12-13 09:38:13 · 525 阅读 · 0 评论 -
cublas runtime error : library not initialized at /opt/conda/conda : PyTorch
RuntimeError: cublas runtime error : library not initialized at /opt/conda/conda-bld/pytorch_1549627089062/work/aten/src/THC/THCGeneral.cpp:250这个问题,网上有人说,可以用删除~/.nv的方式解决在删除之前最好备份下文件cp -r ~/.nv ...原创 2019-04-16 22:58:28 · 4717 阅读 · 0 评论 -
PyTorch : RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED
TensorFlow ImportError: libcublas.so.9.0: cannot open shared object file:PyTorch : RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED这两个问题放在一起解答,而引起的原因不同。PyTorch : RuntimeError: cuDNN err...原创 2019-05-15 23:57:41 · 3087 阅读 · 3 评论 -
Pytorch: ModuleNotFoundError: No module named 'torch_scatter.scatter_cpu'
安装pytorch一些库的时候会遇到类似这样的错误;ModuleNotFoundError: No module named 'torch_scatter.scatter_cpu'ModuleNotFoundError: No module named 'torch_scatter.scatter_cuda'或者;往往都是因为CUDA配置不当造成的。请看我的博客,如何正确的配置CU...原创 2019-05-21 15:48:29 · 8219 阅读 · 0 评论 -
Installation issue: undefined symbol: __cudaPopCallConfiguration
这篇和CUDA安装以及Pytorch: ModuleNotFoundError: No module named 'torch_scatter.scatter_cpu'是姐妹篇,错误原因类似。mpi_lib.cpython-36m-x86_64-linux-gnu.so: undefined symbol:以及:ImportError: libcudart.so.9.0: cannot o...原创 2019-05-21 15:50:52 · 3775 阅读 · 0 评论