Linux查看GPU信息命令

本文详细介绍了如何使用Nvidia提供的nvidia-smi命令行工具来监控GPU的实时使用情况,包括风扇转速、温度、性能状态、能耗、总线信息、显示状态、显存使用率、GPU利用率及计算模式等。此外,还提供了使用watch命令结合nvidia-smi进行实时监控的方法。
Wan2.2-I2V-A14B

Wan2.2-I2V-A14B

图生视频
Wan2.2

Wan2.2是由通义万相开源高效文本到视频生成模型,是有​50亿参数的轻量级视频生成模型,专为快速内容创作优化。支持480P视频生成,具备优秀的时序连贯性和运动推理能力

转载请注明作者和出处: http://blog.youkuaiyun.com/john_bh/

显示GPU当前使用情况

使用Nvidia自带了一个nvidia-smi的命令行工具,会显示显存使用情况:

nvidia-smi

在这里插入图片描述

  • Fan:显示风扇转速,数值在0到100%之间,是计算机的期望转速,如果计算机不是通过风扇冷却或者风扇坏了,显示出来就是N/A
  • Temp:显卡内部的温度,单位是摄氏度;
  • Perf:表征性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能;
  • Pwr:能耗表示;
  • Bus-Id:涉及GPU总线的相关信息;
  • Disp.A:是Display Active的意思,表示GPU的显示是否初始化;
  • Memory Usage:显存的使用率;
  • Volatile GPU-Util:浮动的GPU利用率;
  • Compute M:计算模式;
  • 下边的Processes显示每块GPU上每个进程所使用的显存情况。

如果想实时监控GPU使用情况,可以使用命令watch:

watch [options]  command
  • 最常用的参数是 -n, 后面指定是每多少秒来执行一次命令。
    例如设置每2秒显示一次现存的情况:
watch -n 2 nvidia-smi

在这里插入图片描述
这样,只要开着这个命令行窗口,就可以每2秒刷新一次,想要退出,使用组合键CTRL+C.

您可能感兴趣的与本文相关的镜像

Wan2.2-I2V-A14B

Wan2.2-I2V-A14B

图生视频
Wan2.2

Wan2.2是由通义万相开源高效文本到视频生成模型,是有​50亿参数的轻量级视频生成模型,专为快速内容创作优化。支持480P视频生成,具备优秀的时序连贯性和运动推理能力

<think>好的,用户问的是如何在Linux查看GPU型号的命令。我需要先回想一下常用的命令,然后整理出来。首先想到的是nvidia-smi,这个命令对于NVIDIA显卡非常直接,能显示型号、驱动版本、温度等信息。用户可能是在使用深度学习或者GPU计算时需要确认硬件信息。 然后,可能用户没有安装NVIDIA驱动,这时候nvidia-smi可能用不了。这时候需要用lspci或者lshw,这两个是更通用的硬件查看命令。lspci结合grep可以过滤出显卡信息,而lshw需要root权限,可能用户需要注意。 接下来,用户可能还想知道其他相关信息,比如CUDA版本,或者GPU的使用情况。这时候可能需要补充一些额外的命令,比如nvidia-smi -q或者查看驱动版本。同时,用户可能对命令的输出结果不太熟悉,需要解释如何解读输出中的型号信息。 还要考虑用户可能的错误,比如命令不存在,这时候需要提醒安装相应的工具,比如nvidia-smi需要安装NVIDIA驱动,lshw可能需要安装对应的包。另外,不同的发行版可能有些差异,比如Debian系和Red Hat系的包管理器不同,可能需要提示一下。 然后,用户可能想知道如何区分集成显卡和独立显卡,或者多GPU的情况如何处理。比如,nvidia-smi会列出所有NVIDIA设备,而lspci可能会显示多个条目,用户需要识别正确的设备。 最后,确保回答简洁明了,分点列出主要命令,并给出示例输出,这样用户更容易理解。同时,相关问题部分需要涵盖常见的相关疑问,比如查看CUDA版本、驱动版本、多GPU管理等,帮助用户扩展知识。</think>在 Linux 系统中查看 GPU 型号的主要命令如下: --- ### **1. NVIDIA 显卡专用命令** ```bash nvidia-smi ``` - **功能**:显示 NVIDIA GPU 型号、驱动版本、温度、显存使用等信息- **示例输出**: ``` +-----------------------------------------------------------------------------+ | NVIDIA-SMI 535.54.03 Driver Version: 535.54.03 CUDA Version: 12.2 | |-------------------------------+----------------------+----------------------+ | GPU Name Persistence-M| BusId Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | |===============================+======================+======================| | 0 NVIDIA RTX 3090 Off | 0000:01:00.0 N/A | N/A | | 30% 45C P8 22W / 350W | 10MiB / 24576MiB | 0% Default | +-------------------------------+----------------------+----------------------+ ``` --- ### **2. 通用硬件查询命令** #### **(1) `lspci`(适用于所有显卡)** ```bash lspci | grep -i vga ``` - **功能**:列出显卡的 PCI 设备信息- **示例输出**: ``` 01:00.0 VGA compatible controller: NVIDIA Corporation GA102 [GeForce RTX 3090] (rev a1) ``` #### **(2) `lshw`(需 root 权限)** ```bash sudo lshw -C display ``` - **功能**:详细显示显卡硬件信息- **示例输出**: ``` *-display description: VGA compatible controller product: GA102 [GeForce RTX 3090] vendor: NVIDIA Corporation physical id: 0 bus info: pci@0000:01:00.0 version: a1 width: 64 bits clock: 33MHz capabilities: vga_controller bus_master cap_list rom configuration: driver=nvidia latency=0 resources: irq:123 memory:de000000-dfffffff memory:c0000000-cfffffff memory:d0000000-d1ffffff ioport:e000(size=128) memory:c0000-dffff ``` --- ### **3. 查看 CUDA 和驱动版本** ```bash nvidia-smi -q | grep -i "Driver Version\|CUDA Version" ``` - **用途**:验证 GPU 是否支持特定深度学习框架(如 PyTorch/TensorFlow)。 --- ### **4. 查看 GPU 使用状态** ```bash nvidia-smi --query-gpu=name,temperature.gpu,utilization.gpu,memory.used,memory.total --format=csv ``` - **功能**:实时监控 GPU 状态。 --- ### **注意事项** - **非 NVIDIA 显卡**:`nvidia-smi` 仅支持 NVIDIA 显卡;AMD/Intel 显卡需使用 `lspci` 或 `glxinfo`(需安装 `mesa-utils`)。 - **权限问题**:`lshw` 需要 `sudo` 权限。 - **无驱动情况**:若未安装显卡驱动,`nvidia-smi` 会报错,但 `lspci` 仍可显示硬件型号。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值