GPU使用和管理经验

本文介绍了如何在非conda环境和conda环境下检查CUDA和cuDNN的版本及位置,并提供了相关命令行操作,如`psaux`、`grep`、`lspci`等。还提到了配置环境变量的方法,以及解决GPU相关问题的提示,如显存占用和库文件加载错误。同时,给出了TensorFlow GPU版本与CUDA、cuDNN的对应关系。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

ps aux|grep python|grep -v grep|cut -c 9-15|xargs kill -15 

pstree | grep python

kill -9 pid

查看cuda/cudnn版本与位置

查看

非conda环境

conda环境

适合于

Ubuntu/CentOS 非conda的开发环境

Windows,或 Ubuntu conda_DL、conda全家桶

cuda位置

/usr/local/cuda

分两步执行:

1、激活conda环境。

例如,对conda环境seeingdo_normal,

激活命令为conda activate seeingdo_normal

或 activate seeingdo_normal;

2、输入命令conda list,

查看cudatoolkit的版本。

lspci | grep -i vga

lspci | grep -i nvidia

nvidia-smi#查看任务执行情况

cuda版本

方法1:cat /usr/local/cuda/version.txt

方法2:在命令行输入命令:

nvcc --version 或nvcc -V

cudnn位置

/usr/include 或

/usr/local/cuda/include

cudnn版本

1)比较新的cuDNN,使用命令:

cat /usr/include/cudnn.h |

grep CUDNN_MAJOR -A 2

2)比较旧的cuDNN,使用命令:

cat /usr/local/cuda/include/cudnn.h |

grep CUDNN_MAJOR -A 2

2021最新:TensorFlow各个GPU版本CUDA和cuDNN对应版本整理(最简洁)

参考了 cuda安装与可能遇到的问题https://www.jianshu.com/p/f71bbf2ecde3

1)安装完显卡驱动和cuda及cudnn后,需要配置好环境变量

2)在~/.bashrc中添加如下

        export PATH=/usr/local/cuda/bin:$PATH

        export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

    使环境变量生效source  ~/.bashrc

3)配置 /etc/ld.so.conf.d/cuda.conf

    添加如下内容  /usr/local/cuda/lib64

使库生效 sudo ldconfig

QA:

Keras指定显卡并限制显存使用(tensorflow后端)

查看GPU状态:https://www.codenong.com/cs106484391/

1、GPU无法加载库文件Could not load dynamic library 'libcudart.so.10.0' - 知乎

2、GPU Memcpy failed

原来我有个任务在debug占用了gpu资源https://www.codenong.com/46040854/

Make sure you have no other processes using the GPU running. Run nvidia-smi to check this.

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值