目前只知道需要3条命令查看显存,如果哪位大佬知道只要一条命令就可以,欢迎指点。
好,开始正文。
查看程序占用的显存主要分为三步:
- 找到自己的进程id
- 根据id找到那台服务器(结点),服务器(结点)上会记录第几块卡
- 根据服务器结点和卡的编号查看显存占用
举个例子:
- 找到自己的进程id
bjobs -w

可以看出进程号是:58170
2. 根据id找到那台服务器(结点),服务器(结点)上会记录第几块卡
bjobs -l 58170

找到 r1cmpsrvs79-14ig0602:gpus=3。其中”r1cmpsrvs79-14ig0602“代表结点编号;“gpus=3”代表3号卡
3.最后一步。根据服务器结点和卡的编号查看显存占用
lsload -gpuload -w r1cmpsrvs79-14ig0602

找到3号卡,可以看出一共用了27.5G的显存。
本文介绍了一种通过三步操作查看GPU显存占用的方法:首先确定进程ID,其次定位到运行该进程的服务器及其所用GPU编号,最后查询特定GPU的显存使用情况。示例中展示了如何使用bjobs和lsload-gpuload-w命令组合完成这一过程。
3318





