前言
因为实验室有很多台 GPU 服务器,每次要运行代码都要一台一台跑上去看GPU有没有人用,所以就写了一个这种小程序,代码地址在这里
效果图
curl http://127.0.0.1:7070/info
>> 2023-06-03 12:01:31 [watchcorgi]
+---------+------+------+-------------------------------------+------+-------------------+--------------+-----------+
| name |cpu[s]|cpu[u]| gpu device |gpu[u]| gpu[m] | gpu user |update time|
+---------+------+------+-------------------------------------+------+-------------------+--------------+-----------+
| gpu1 | 0.0 %| 0.0 %| A100-PCIE-40GB(460.106.00) | 0 % | 0 MiB/40536 MiB | null | 12:01:22 |
| | | | A100-PCIE-40GB(460.106.00) | 17 % | 0 MiB/40536 MiB | | |
+---------+------+------+-------------------------------------+------+-------------------+--------------+-----------+
| gpu2 | 0.0 %| 0.0 %| NVIDIA GeForce RTX 3090(515.65.01) | 0 % | 2 MiB/24576 MiB

Watchcorgi是一个用于监控多台GPU服务器的小程序,它可以显示GPU使用情况,包括利用率、内存占用等信息。用户可以通过curl命令获取实时状态,项目采用Rust编写,并依赖Redis。提供了通过systemd进行服务管理的配置示例。
最低0.47元/天 解锁文章
2244

被折叠的 条评论
为什么被折叠?



