- 博客(17)
- 收藏
- 关注
原创 RuntimeError: CUDA error: CUBLAS_STATUS_INVALID_VALUE when calling `cublasSgemm( handle, opa, opb, m
【代码】RuntimeError: CUDA error: CUBLAS_STATUS_INVALID_VALUE when calling `cublasSgemm( handle, opa, opb, m。
2024-08-29 10:11:55
164
原创 RuntimeError: CUDA error: invalid device ordinal CUDA kernel errors might be asynchronously reported
torch.cuda.set_device()是大型项目中用于设置GPU设备编号的函数,而os.environ[“CUDA_VISIBLE_DEVICES”]则是我们在日常工作中更常使用的设置方式。翻遍了所有程序代码中与device有关的设置,抱着试一试的心态,打开Dassl3D文件夹下的dassl,然后打开config中的defaults.py,将其中的一行命令_C.GPU = 'cuda:1’改为了_C.GPU = ‘cuda:0’,问题就这样神奇解决了,说实话我也不太明白为什么这样改就能成功。
2024-08-29 10:04:54
396
原创 Linux xshell断开或者网络中断 如何让程序一直在服务器后台运行
这个会话相当于一个后台进程,你可以在这个会话里运行程序,这个会话会一直存在,直到你用命令把他删掉。只要会话还存在,里面的程序就会一直运行。所以这个会话里的程序不会因为你关闭xshell就自动停止。
2024-03-19 20:26:15
1050
1
原创 ImportError: libmkl_intel_lp64.so: cannot open shared object file: No such file or directory
ImportError: libmkl_intel_lp64.so: cannot open shared object file: No such file or directory
2022-10-03 20:28:38
1760
原创 File “/home/dh/anaconda3/envs/zyq1/lib/python3.6/site-packages/tensorboard/compat/proto/tensor_shape
File "/home/dh/anaconda3/envs/zyq1/lib/python3.6/site-packages/tensorboard/compat/proto/tensor_shape
2022-09-30 13:22:32
1830
原创 ImportError: /home/dh/anaconda3/lib/libstdc++.so.6: version `CXXABI_1.3.11‘ not found
ImportError: /home/dh/anaconda3/lib/libstdc++.so.6: version `CXXABI_1.3.11' not found
2022-06-24 11:03:40
2104
1
原创 RuntimeError: Attempting to deserialize object on a CUDA device but torch.cuda.is_available() is Fal
RuntimeError: Attempting to deserialize object on a CUDA device but torch.cuda.is_available() is False. If you are running on a CPU-only machine, please use torch.load with map_location='cpu' to map your storages to the CPU.
2020-12-19 10:32:13
9726
6
原创 Segmentation fault (core dumped)
今天遇到一个极其烧脑的问题,在运行程序过程中出现错误,报错Segmentation fault (core dumped),查找各种资料,尝试了网上的很多的方法,但都以失败告终。最后,看到一篇文章,提示可能是import的包的版本问题,于是抱着试一试的心态再做最后一次挣扎。因为在之前服务器上已经修改能顺利跑通,但是后来因为内存原因,服务器不能进行读写操作,于是又换了一台服务器,重新搭建了环境,中间坎坷就不用多说了,此处省略一万字。在新的服务器上创建完环境之后,战战兢兢地准备尝试运行程序,结果就出现了前面所提
2020-08-11 22:48:51
525
原创 GPU重启问题
在服务器终端输入nvidia-smi出现错误Unable to determine the device handle for GPU 0000:01:00.0: GPU is lost. Reboot the system to recover this GPU解决方案:输入指令sudo shutdown -r now即可重新启动驱动。如果还是无法解决则需要重新安装驱动。...
2020-07-20 15:47:09
5555
原创 ModuleNotFoundError: No module named easydict
ModuleNotFoundError: No module named ‘easydict’解决方法:访问官方网址下载:https://pypi.org/project/easydict/#files下载压缩包上传到服务器某一文件夹下并进行解压,切换到所在文件夹,执行以下命令解压:$tar -xzvf easydict-1.9.tar.gz然后安装:$python setup.py install --user (在easydict-1.9文件夹下执行命令)ok完成。...
2020-06-23 16:59:19
936
原创 RuntimeError: The Session graph is empty. Add operations to the graph before calling run().
在Winsdows下anaconda3中创建了python35的虚拟环境并安装了tensorflow2.0.0版本,配置如下:conda create --name python35 python=3.5activate python35pip install --upgrade --ignore-installed tensorflow在测试tensorflow时,多次调试,将ses...
2019-12-30 20:25:47
1578
原创 tensorflow显存管理问题
在服务器虚拟环境中运行程序,tensorflow会默认占用所有的资源,可以在主程序中添加以下代码:import tensorflow as tfimport osos.environ["CUDA_VISIBLE_DEVICES"] = '1' config = tf.ConfigProto()config.gpu_options.per_process_gpu_memory_frac...
2019-12-18 15:08:55
186
原创 服务器虚拟环境中记录日志
在服务器虚拟环境中记录日志,可执行以下命令:$ python 程序名字.py 2>&1|tee 日志名字.log查看服务器中GPU资源占用可执行命令:$ nvidia-smi查看具体的程序可执行命令:$ ps -aux...
2019-12-18 14:57:15
166
原创 IOError: [Errno 2] No such file or directory和EOFError问题
运行程序过程中出现错误Traceback (most recent call last):File “office_wd.py”, line 11, in xs, ys, xt, yt, xt_test, yt_test = utils.load_office(source_name, target_name, data_dir, feature_type)source = pkl.load...
2019-12-17 15:44:21
1012
原创 ValueError:Tensor conversion requested dtype float32 for Tensor with dtype float64.
在运行程序时出现 ValueError:Tensor conversion requested dtype float32 for Tensor with dtype float64.考虑上述错误应该是数据类型问题,因此更改程序中的代码。原来代码:with tf.name_scope(layer_name): weight = tf.Variable(tf.truncated_...
2019-12-17 10:46:21
7942
3
原创 TensorflowImportError: libcusolver.so.8.0: cannot open shared object file: No such file or directory
在服务器虚拟环境中anaconda2+python2.7下安装tensorflow1.3.0版本使用conda install tensorflow-gpu=1.3.0时安装失败因此使用命令pip install tensorflow-gpu==1.3.0安装,但在测试tensorflow是否安装成功时输入import tensorflow as tf出现错误ImportError: lib...
2019-12-17 10:38:36
358
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人