在Linux终端下查看GPU正常使用的情况

最新推荐文章于 2025-10-24 17:25:38 发布

原创最新推荐文章于 2025-10-24 17:25:38 发布 · 9.3k 阅读

35 ·

CC 4.0 BY-SA版权

文章标签：

#python

linux 专栏收录该内容

7 篇文章

订阅专栏

在Linux环境下，可以通过命令查看GPU使用情况，如nvidia-smi实时刷新展示显存使用。若需结束GPU进程，可指定PID进行关闭。显存占用与GPU占用不同，根据运行的代码类型（如TensorFlow或Caffe），二者占用比例会有所变化。

部署运行你感兴趣的模型镜像

首先，在终端输入nvidia-smi：

可以查看当前正常使用的GPU情况，如下图所示：
在这里插入图片描述
如果要一直刷进度 nvidia-smi -l (一般看数据训练情况) nvidia-smi 实时刷新实时显示显存使用情况

进程会一直刷出来~

想要终止其中某个/或几个GPU进程，可通过以下命令实现：kill -9 PID
现在要关闭占用2和3号GPU的四个进程的PID分别是：19341、19367、19341、19367

（其实，后2个和前2个是一样的，因为我在训练的时候指定了用2个GPU训练，实际只包含2个PID）
在这里插入图片描述
在终端输入后，回车：
kill -9 19341 19367 19341 19367
（进程之间用空格隔开）

结果如下：
在这里插入图片描述
对于NVIDIA的显存详细注释如下：

显存占用和GPU占用是两个不一样的东西，显卡是由GPU和显存等组成的，显存和GPU的关系有点类似于内存和CPU的关系。跑caffe代码的时候显存占得少，GPU占得多；跑TensorFlow代码的时候，显存占得多，GPU占得少。
简而言之：
显卡=GPU+显存+…… 类似 CPU+内存

您可能感兴趣的与本文相关的镜像

TensorFlow-v2.15

TensorFlow

TensorFlow 是由Google Brain 团队开发的开源机器学习框架,广泛应用于深度学习研究和生产环境。它提供了一个灵活的平台,用于构建和训练各种机器学习模型