python 使用 pynvml 工具获取GPU工作状态

最新推荐文章于 2024-01-08 22:02:39 发布

苍蓝儿

最新推荐文章于 2024-01-08 22:02:39 发布

阅读量1.7k

点赞数 1

分类专栏： Python 文章标签： python

本文链接：https://blog.youkuaiyun.com/zywvvd/article/details/109538780

版权

Python 专栏收录该内容

61 篇文章

订阅专栏

深度学习过程中经常需要和GPU打交道，需要在训练之前确定GPU工作状态。本文介绍python中的pynvml包的使用方法，用来获取上述信息。

安装

直接通过pip安装：

pip install nvidia-ml-py

或者根据所使用的python版本安装对应包：

pip install nvidia-ml-py2  # python2
pip install nvidia-ml-py3  # python3

使用方法

# 导入包
import pynvml 
# 每MB包含的字节数
NUM_EXPAND = 1024 * 1024
# 初始化
pynvml.nvmlInit()

#GPU驱动信息
pynvml.nvmlSystemGetDriverVersion()
-> b'441.22'

#获取Nvidia GPU块数
pynvml.nvmlDeviceGetCount()
-> 1

#获取GPU 0 的handle
handle = pynvml.nvmlDeviceGetHandleByIndex(0)

# 设备名称
pynvml.nvmlDeviceGetName(handle)
-> b'GeForce GTX 1660'

#通过handle获取GPU 0 的信息
info = pynvml.nvmlDeviceGetMemoryInfo(handle)

#GPU 0 的总显存
info.total 
-> 6442450944
info.total / NUM_EXPAND
-> 6144.0

#GPU 0 使用的显存
info.used
-> 383299584
info.used / NUM_EXPAND
-> 365.54296875

#关闭 pynvml
pynvml.nvmlShutdown()

踩坑

报错： pynvml.NVMLError_LibraryNotFound: NVML Shared Library Not Found

坑已填：解决 pynvml 报错 NVML Shared Library Not Found / WinError 126

参考资料

http://www.ngui.cc/51cto/show-33630.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

苍蓝儿

关注关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

如何使用pynvml查看GPU的显存使用情况

03-28

798

在进行深度学习训练时，经常需要监控GPU的显存使用情况。pynvml是一个Python模块，可以利用NVIDIA Management Library (NVML)来查询GPU的显存使用情况。本文将介绍如何使用pynvml来查看GPU的显存使用情况。通过使用pynvml模块，我们可以很方便的查询GPU的显存使用情况，这对于调试和优化深度学习模型非常有帮助。如何使用pynvml查看GPU的显存使用情况。方法打开某个索引处的GPU，并使用。方法查询内存使用情况。上述代码中，我们使用。

【Python】查看当前 GPU一些资源信息 | 区块链面试题：区块链技术中，如何防止“双花”攻击？| 共识机制，区块确认，交易签名，UTXO模型，51%攻击防护

追光者♂：记录、分享、总结、提升，现象级专栏《Python从入门到人工智能》作者，无惧黑暗，坚信曙光

10-06

1440

查看GPU的一些资源信息。【Python】查看当前 GPU一些资源信息 | 区块链面试题：区块链技术中，如何防止“双花”攻击？| 共识机制，区块确认，交易签名，UTXO模型，51%攻击防护

参与评论您还未登录，请先登录后发表或查看评论

pynvml 获取显卡个数以及 DriverModel

comedate的专栏

08-18

569

#!/usr/bin/env python # encoding: utf-8 import pynvml def check_driver_model_wddm(gpu_id): """检查GPU是否是WDDM模式，才能使用OpenGL.gpu_id是从0开始计数; 显卡驱动模式 0 WDDM, 1 tcc""" pynvml.nvmlInit() if gpu_id < pynvml.nvmlDeviceGetCount(): handler = py.

Python使用pynvml查看GPU信息

TracelessLe的专栏

07-17

4541

前言 NVIDIA为自己家的显卡提供了NVML（英伟达显卡管理库）和构建在其上的nvidia-smi(显卡系统管理界面)，用户可以很方便的在系统命令窗口查询显卡信息和当前工作状况。在Python中同样可以利用相应的package实现以上功能，这个好用的package就是pynvml库，可以通过它来获取NVIDIA显卡信息。安装直接通过pip安装： pip install nvidia-ml-py 或者根据所使用的python版本安装对应包： pip install nvidia-ml-py2

【Python管理GPU】pynvml工具的安装与使用

热门推荐

TomRen

11-10

3万+

可以利用python实现显卡信息读取与管理

使用 pynvml 得到显卡信息

comedate的专栏

11-19

514

使用 pynvml 这个库，可以得到显卡的使用环境，如显卡类型，显卡数目，显卡全部显存，已经使用的显存，以及没有使用的显存。

Python获取磁盘使用信息，python获取GPU信息，python根据进程号获取进程信息，pynvml 获取GPU信息，psutil 获取进程信息,系统信息等

采菊东篱下，Python满乾坤！

11-12

1903

一、工具：psutil模块 psutil是一个跨平台模块，试用相应方法可以直接获取计算机CPU，内存，磁盘，网络等资源使用情况；可以使用我们学习知识与这模块用来做系统监控，性能分析；如果大家熟悉Linux系统，它能够实现ps、top、lsof、netstat、df等命令功能。 1.1、psutil安装： psutil是第三方模块，使用时候需要要安装，相关说明链接地址：https://pypi.org/project/psutil/； pip安装方式： pip install psutil 验.

Python获取磁盘使用信息，python获取GPU信息！

爬遍所有网站

11-17

1649

一、工具：psutil模块 psutil是一个跨平台模块，试用相应方法可以直接获取计算机CPU，内存，磁盘，网络等资源使用情况；可以使用我们学习知识与这模块用来做系统监控，性能分析；如果大家熟悉Linux系统，它能够实现ps、top、lsof、netstat、df等命令功能。 1.1、psutil安装： PS：如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资料以及群交流解答点击即可加入 psutil是第三方模块，使用时候需要要安装，相关说明链接地址： h.

pyminihw:PB071的Python迷你硬件检查器

03-17

此外，它可能还利用了像是pynvml这样的库来获取NVIDIA GPU的信息，或者使用smartmontools来获取硬盘健康状态等。通过这些库的组合，PyMiniHw能够提供全面的硬件信息报告。使用PyMiniHw非常简单。在Python环境中，...

Python：使用pynvml获取和监控 NVIDIA GPU 设备的信息

彭世瑜的博客

11-18

985

pynvml 是一个 Python 包，用于与 NVIDIA 的管理库 NVML（NVIDIA Management Library）进行交互，以获取和监控 NVIDIA GPU 设备的信息。它提供了一组函数和类，可以查询 GPU 设备的状态、显存使用情况、温度、功耗等信息。文档安装需要安装 NVIDIA 驱动程序和 CUDA 工具包示例。

NVIDIA简单理解之pynvml库

April_Zhao的博客

01-08

4015

NVIDIA显卡展示信息

pynvml 查看GPU已使用的显存

jacke121的专栏

10-09

6182

Python查看GPU已使用的显存版权声明：随意转载，不用告诉我，但链接到就行。 https://blog.youkuaiyun.com/u011094454/article/details/80774495 pip安装pynvml pip install nvidia-ml-py3 如果是Python2，则pip nvidia-ml-py2 之后可以在Python3 下使用了 imp...

监控显卡显存（python代码）

lihaiyuan_0324的博客

01-08

783

监控显卡显存

查看显存占用大小

weixin_40777649的博客

12-08

256

【代码】查看显存占用大小。

pytorch 训练过程中查看GPU显存占用情况

weixin_47032489的博客

04-11

5775

查看Python 代码的内存和模型显存消耗以及优化。

小技巧随手记：Python查看windows下GPU的使用情况

蓝多多的小仓库

11-22

7482

目录一、使用nvidia-smi查看Windows的CUDA版本及GPU信息二、使用pynvml查看GPU使用情况的命令三、python 中使用GPUti实时查看GPU状况四、使用gpustat库实时监测GPU使用情况（Linux下可以，Windows下不行的，衍生问题暂时没有一个好的解决方案）一、使用nvidia-smi查看Windows的CUDA版本及GPU信息在cmd中输入如下命令： nvidia-smi 二、使用pynvml查看GPU使用情况的命令首先安装.

【教程】Python实时检测CPU和GPU的功耗

xfxuezhang.cn

01-27

1万+

亲测可用，附完整代码！

pycharm中如何实时查看gpu的使用量

最新发布

04-03

### PyCharm 中实时监控 GPU 使用量的方法要在 PyCharm 中实现实时监控 GPU 的使用情况，可以借助 Python 库 `nvidia-ml-py3` 来获取 NVIDIA GPU 的状态数据，并将其集成到项目中以便于观察。以下是具体方法： #### 安装依赖库首先需要安装 `nvidia-ml-py3` 库来访问 NVML 功能并查询 GPU 状态。可以通过 pip 命令完成安装： ```bash pip install nvidia-ml-py3 ``` 此库提供了对 NVIDIA Management Library (NVML) API 的封装，允许开发者通过 Python 查询 GPU 温度、内存占用率以及计算利用率等指标[^1]。 #### 编写监控脚本编写一段简单的 Python 脚本来定期读取 GPU 数据并在终端显示出来。下面是一段示例代码： ```python import pynvml import time def initialize_nvml(): """初始化 NVML""" try: pynvml.nvmlInit() except Exception as e: print(f"无法初始化 NVML: {e}") exit(1) def get_gpu_info(index=0): """获取指定索引号的 GPU 信息，默认第一个 GPU""" handle = pynvml.nvmlDeviceGetHandleByIndex(index) # 获取显卡名称 name = pynvml.nvmlDeviceGetName(handle).decode('utf-8') # 获取显存使用情况 meminfo = pynvml.nvmlDeviceGetMemoryInfo(handle) memory_used = meminfo.used / 1024 ** 2 # 单位 MB # 获取当前温度 temperature = pynvml.nvmlDeviceGetTemperature(handle, pynvml.NVML_TEMPERATURE_GPU) return { 'name': name, 'memory_used': f"{memory_used:.2f}MB", 'temperature': f"{temperature}°C" } if __name__ == "__main__": initialize_nvml() while True: info = get_gpu_info() # 默认监控第 0 号 GPU print(f"\rGPU Name: {info['name']} | Memory Used: {info['memory_used']} | Temperature: {info['temperature']}", end="") time.sleep(1) # 每隔一秒刷新一次 ``` 上述代码会持续打印目标 GPU 的基本信息至控制台窗口，包括设备名、已使用的显存量和核心温度。 #### 配置环境变量（可选）如果是在多 GPU 平台上工作，则可能还需要调整可见的 GPU 设备列表以减少干扰或分配资源给不同进程独占使用。这可通过修改操作系统级别的环境变量 `CUDA_VISIBLE_DEVICES` 实现[^2]。例如，在启动脚本前加入如下命令限定仅能看到第二张卡（假设其逻辑序列为1）： ```bash export CUDA_VISIBLE_DEVICES=1 ``` 这样做的好处是可以让后续加载的所有基于 CUDA 的操作都局限于所选定的一组物理 GPUs 上面执行而不会影响其他未被提及的部分。 #### 将监控嵌入 PyCharm 工作流为了更方便地查看这些动态变化的数据，可以直接把上面提到的小工具作为独立模块引入自己的主要应用程序里头去；或者干脆另开一个专门负责展示统计数值的新线程/子进程来做这件事儿——总之就是想办法让它跑起来的同时不影响主线业务流程正常运转即可。 ---