使用shell脚本来监测当前服务器GPU资源使用

      由于公司装有GPU的服务器很少,当多个人同时使用GPU进行计算时就会导致OOM,但频繁的去查看GPU使用,又觉得很麻烦,枯燥的活还是让脚本干吧,所以从零开始写了个脚本,将中间遇到的问题进行下总结。

      过程中熟悉了下if-then-else-fi,while-do-done等逻辑判断方式,还有在脚本中输入用户密码的方法,整个脚本就几行,十分简洁。

     1、    变量的赋值要注意不能有空格,比如string=`top -n 1`,等号两边不能有空格。

     2、    if ["$string" = ""];(这里必须加空格)then

                  echo "password"|sudo -S python *.py

               else

                      echo "gpu正在使用"

                fi

      3、    在使用while语句持续监测资源使用状态

                while [ "$string" != "" ] #这里 '['(空格) "$string" != ""'(空格)]'

                 do

                     echo "gpu正在使用"

                     sleep time

                     string=`cmd`

                 done

                  echo "password"|sudo -S python *.py

        简单的脚本就可以省掉很多无意义的工作,又能充分的利用计算资源,但GPU可能会说,就TM不能让我歇会?

                

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值