Linux查看GPU信息和使用情况

本文介绍如何在Linux系统中使用lspci和nvidia-smi命令查看Nvidia显卡的详细信息,包括显卡型号、显存使用情况、风扇转速、温度等,并演示了如何周期性地监控显卡状态。

Linux查看显卡信息:

lspci | grep -i vga


使用nvidia GPU可以:

lspci | grep -i nvidia

 

[root@gpu-server-002 ~]# lspci | grep -i nvidia
02:00.0 VGA compatible controller: NVIDIA Corporation Device 1b06 (rev a1)
02:00.1 Audio device: NVIDIA Corporation Device 10ef (rev a1)
03:00.0 VGA compatible controller: NVIDIA Corporation Device 1b06 (rev a1)
03:00.1 Audio device: NVIDIA Corporation Device 10ef (rev a1)
82:00.0 VGA compatible controller: NVIDIA Corporation Device 1b06 (rev a1)
82:00.1 Audio device: NVIDIA Corporation Device 10ef (rev a1)
83:00.0 VGA compatible controller: NVIDIA Corporation Device 1b06 (rev a1)
83:00.1 Audio device: NVIDIA Corporation Device 10ef (rev a1)

  

前边的序号 "00:0f.0"是显卡的代号(这里是用的虚拟机);

查看指定显卡的详细信息用以下指令:


lspci -v -s 00:0f.0

Linux查看Nvidia显卡信息及使用情况

Nvidia自带一个命令行工具可以查看显存的使用情况:


nvidia-smi

 

[root@gpu-server-002 ~]# nvidia-smi
Tue Nov 27 00:20:51 2018       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 384.98                 Driver Version: 384.98                    |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 108...  On   | 00000000:02:00.0 Off |                  N/A |
| 66%   85C    P2   175W / 250W |  10795MiB / 11172MiB |    100%      Default |
+-------------------------------+----------------------+----------------------+
|   1  GeForce GTX 108...  On   | 00000000:03:00.0 Off |                  N/A |
| 56%   83C    P2   162W / 250W |  10795MiB / 11172MiB |    100%      Default |
+-------------------------------+----------------------+----------------------+
|   2  GeForce GTX 108...  On   | 00000000:82:00.0 Off |                  N/A |
| 52%   82C    P2   250W / 250W |  10795MiB / 11172MiB |     90%      Default |
+-------------------------------+----------------------+----------------------+
|   3  GeForce GTX 108...  On   | 00000000:83:00.0 Off |                  N/A |
| 54%   83C    P2   126W / 250W |  10795MiB / 11172MiB |     82%      Default |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0     11161      C   python                                     10785MiB |
|    1     11161      C   python                                     10785MiB |
|    2     12049      C   python                                     10785MiB |
|    3     12049      C   python                                     10785MiB |

  


表头释义: 

Fan:显示风扇转速,数值在0到100%之间,是计算机的期望转速,如果计算机不是通过风扇冷却或者风扇坏了,显示出来就是N/A; 
Temp:显卡内部的温度,单位是摄氏度;
Perf:表征性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能;
Pwr:能耗表示; 
Bus-Id:涉及GPU总线的相关信息; 
Disp.A:是Display Active的意思,表示GPU的显示是否初始化; 
Memory Usage:显存的使用率; 
Volatile GPU-Util:浮动的GPU利用率;
Compute M:计算模式; 
下边的Processes显示每块GPU上每个进程所使用的显存情况。

 

如果要周期性的输出显卡的使用情况,可以用watch指令实现:


watch -n 10 nvidia-smi
命令行参数-n后边跟的是执行命令的周期,以s为单位。

 


---------------------
作者:-牧野-
来源:优快云
原文:https://blog.youkuaiyun.com/dcrmg/article/details/78146797
版权声明:本文为博主原创文章,转载请附上博文链接!

查看LinuxGPU使用情况,可以使用nvidia-smi命令。该命令可以显示当前正常使用的GPU情况,包括GPU的使用率、温度、风扇转速、显存使用情况信息。运行命令nvidia-smi将显示这些信息。 如果想要实时刷新显示GPU使用情况,可以使用命令nvidia-smi -l。这将持续刷新并显示数据训练情况。另外,使用nvidia-smi命令还可以查看特定GPU的显存使用情况,命令为nvidia-smi -i GPU编号。 如果需要终止某个或多个GPU的进程,可以使用kill命令。例如,要关闭占用2号3号GPU的四个进程,可以使用命令kill -9 19341 19367 19341 19367。 另外,如果要在运行程序之前指定使用哪块显卡,可以使用CUDA_VISIBLE_DEVICES=GPU编号来指定。这样可以避免程序占用全部显卡,命令为CUDA_VISIBLE_DEVICES=GPU编号 python ***.py。 综上所述,要查看Linux下的GPU使用情况,可以使用nvidia-smi命令,可以实时刷新显示,也可以终止特定GPU的进程。同时,还可以使用CUDA_VISIBLE_DEVICES来指定使用哪块显卡。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [在Linux终端下查看GPU正常使用的情况](https://blog.youkuaiyun.com/weixin_44245653/article/details/118928305)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* *3* [Linux查看GPU信息使用情况](https://blog.youkuaiyun.com/weiyumeizi/article/details/83035711)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值