多卡服务器下隐藏部分 GPU 和 TensorFlow 的显存使用设置

最新推荐文章于 2022-11-08 21:25:22 发布

原创最新推荐文章于 2022-11-08 21:25:22 发布 · 1.8k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#配环境 #深度学习 #Keras

机器学习/深度学习同时被 2 个专栏收录

21 篇文章

订阅专栏

疑难杂症

10 篇文章

订阅专栏

本文介绍了如何通过设置环境变量CUDA_VISIBLE_DEVICES来管理服务器上的GPU资源，实现特定任务仅对指定的GPU可见。此外还提供了调整显存使用比例及按需增长的方法。

部署运行你感兴趣的模型镜像

服务器有多张显卡，一般是组里共用，分配好显卡和任务就体现公德了。除了在代码中指定使用的 GPU 编号，还可以直接设置可见 GPU 编号，使程序/用户只对部分 GPU 可见。

操作很简单，使用环境变量 CUDA_VISIBLE_DEVICES 即可。
具体来说，如果使用单卡运行 Python 脚本，则可输入

CUDA_VISIBLE_DEVICES=1 python my_script.py

脚本将只使用 GPU1。
在 .py 脚本和 Notebook 中设置，则

import os
os.environ["CUDA_VISIBLE_DEVICES"] = "2"

还可以直接设置临时的环境变量：

export CUDA_VISIBLE_DEVICES="0"

此时该用户的 CUDA 只看得见 GPU0。

至于显存设置，可以设置使用比例(70%)：

gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.7)
sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options))

也可以按需增长：

config = tf.ConfigProto()
config.gpu_options.allow_growth = True
session = tf.Session(config=config, ...)

如果是 Keras 使用 TensorFlow 后端，则可通过如

import tensorflow as tf 
from keras.backend.tensorflow_backend import set_session
config = tf.ConfigProto()
config.gpu_options.allow_growth = True
set_session(tf.Session(config=config))

更改使用设置。

您可能感兴趣的与本文相关的镜像

PyTorch 2.5

PyTorch

Cuda

PyTorch 是一个开源的 Python 机器学习库，基于 Torch 库，底层由 C++ 实现，应用于人工智能领域，如计算机视觉和自然语言处理