查看GPU使用的最佳方式

本文介绍了多种用于监控GPU使用情况的工具,包括nvidia-smi、gpustat、nvtop、nvitop、glances以及protheus+grafana。这些工具各具特点,从简单的命令行工具到全面的系统监控解决方案,满足不同用户对GPU监控的需求。例如,nvitop提供了详细的进程信息和GPU占用情况,而protheus+grafana则通过可视化界面展示详细的GPU和系统指标。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. watch -n 1 nvidia-smi (最有名,没有之一) 

nvidia自带了一个nvidia-smi的命令行工具,会显示GPU使用情况

​​​​​​​

 作为监控 GPU 的工具就显得有点过于简陋了。比如 Process name 栏只显示命令行的程序名,不显示参数,这样输出结果就是一堆 python 和 .../Miniconda3/envs/xxx/python 之类的,完全没有区分性以及进程信息并不包含用户和运行时间等信息。

2. gpustat -i (彩色并简约的显示) 

pip install gpustat


 显然这种带高亮的显示看起来更舒服,而且可以显示出完整显卡的完整名称,以及正在使用GPU的用户,一个缺点就是不能像nvidia-smi一样显示出各个进程的信息 

3. nvtop (完整的信息,需root权限apt安装,不是非常方便)

sudo apt install nvtop


 能够非常优雅地全面地监控显卡信息 

4. nvitop (完整的信息,可作为Python的库安装,非常方便)

pip install nvitop

<think>好的,用户想通过NVIDIA驱动程序或工具监控GPU使用率。我需要先回想一下相关的命令和工具。记得之前看到的引用里提到用nvidia-smi命令来验证驱动安装,可能这个命令也能显示使用率。 首先,用户可能已经安装了NVIDIA驱动,所以应该先确认驱动是否正确安装。可以运行nvidia-smi,这个命令会显示GPU的基本信息,包括使用率。在输出里,应该有一个“Utilization”部分,显示GPU的百分比使用情况。比如,用户提到的引用[^1]里就是用nvidia-smi来验证驱动的,所以这个命令肯定有效。 然后,如果用户需要实时监控,可能需要持续刷新显示。我记得nvidia-smi有一个选项可以定期更新,比如加上-l或--loop参数,比如nvidia-smi -l 1可以每秒刷新一次。这样用户就能看到实时变化的使用率了。 另外,除了命令行工具,NVIDIA还提供了图形化工具,比如NVIDIA System Management Interface (nvidia-smi)的GUI版本,或者集成到系统监控工具里的插件。不过用户可能更倾向于命令行,尤其是服务器环境下。 还有,用户的问题可能不仅限于使用率,可能还包括温度、内存使用等情况。nvidia-smi默认会显示这些信息,所以可以提醒用户注意输出的各个指标,比如显存使用(Memory-Usage)和GPU-Util。 需要注意的是,如果用户没有安装驱动,这些命令可能不可用,但根据引用[^2],用户已经以2080Ti为例安装了驱动,所以应该没问题。但可能需要确认安装的驱动版本是否支持这些功能,不过一般来说现代驱动都支持。 最后,可能需要提到其他工具,比如tegrastats(适用于Jetson设备)或者第三方监控工具,但主流的是nvidia-smi。所以主要回答应围绕这个命令展开,包括基本使用、实时监控和解释输出内容。</think>要监控 NVIDIA GPU使用率,可通过以下步骤实现: ### 1. **使用 `nvidia-smi` 命令行工具** 这是 NVIDIA 驱动程序自带的系统管理接口工具,可直接显示 GPU 实时状态: ```bash nvidia-smi ``` 输出示例: ``` +-----------------------------------------------------------------------------+ | NVIDIA-SMI 470.57.02 Driver Version: 470.57.02 CUDA Version: 11.4 | |-------------------------------+----------------------+----------------------+ | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | |===============================+======================+======================| | 0 GeForce RTX 208... On | 00000000:01:00.0 Off | N/A | | 30% 45C P0 45W / 250W | 200MiB / 11019MiB | 15% Default | +-------------------------------+----------------------+----------------------+ ``` - **关键指标**: - `GPU-Util`:GPU 计算核心利用率百分比(即使用率)[^1] - `Memory-Usage`:显存使用情况 - `Temp`:GPU 温度 ### 2. **实时刷新监控** 通过添加 `-l` 参数实现周期性刷新(例如每秒刷新一次): ```bash nvidia-smi -l 1 ``` ### 3. **图形化工具(可选)** - **NVIDIA System Management Interface (nvidia-smi) GUI**:部分 Linux 发行版可通过 `nvidia-smi-gui` 包安装 - **集成到系统监控工具**:如 `htop` 插件或 `gpustat`(需额外安装): ```bash pip install gpustat gpustat -i 1 # 每秒刷新一次 ``` ### 4. **进阶用法** 筛选特定信息(如仅显示使用率): ```bash nvidia-smi --query-gpu=utilization.gpu --format=csv ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值