负载限制(loadSched和loadStop)

lsb.queue文件

lsb.queue 文件做如下配置:

Begin Queue

QUEUE_NAME = test

PRIORITY = 35

FAIRSHARE = USER_SHARES[[default,1]]

# mem/r15s/r1m/r15m/ut=loadSched/loadStop
  • loadSched 必须先满足条件,然后才能将作业分派到主机。
    • 如果是mem
      • 可用于调度的值大于此值,才开始接收作业
      • 用于调度的值小于此值,就拒绝接收作业
  • 如果是系统负载r15s、r1m、r15m、ut
    • 设置的是已使用达到多少,就暂挂主机上的作业
  • 如果 loadStop 满足条件,将暂挂主机上的作业,保留一个作业正常运行,等这个作业运行完并释放资源后,再逐步运行其他作业。
    • 如果是mem配置的是可用于调度的值不足此值,就暂挂主机上的作业
    • 如果是系统负载r15s、r1m、r15m/ut设置的是已使用达到多少,就暂挂主机上的作业
ut = 0.8/0.9

#Sort by ut

RES_REQ = order[ut]    寻找CPU资源比较多的机器来运行作业

# RES_REQ = order[mem]    寻找MEM资源比较多的机器来运行作业

End Queue

可用内存(lsload查看到的mem 2.6G)

=可用于调度的内存(bhosts -l Total 2.6G)+预留的内存(bhosts -l中 Reserved 9M

[lsfadmin@master ~]$ lsload node2

HOST_NAME       status  r15s   r1m  r15m   ut    pg  ls    it   tmp   swp   mem

node2               ok   0.0   0.1   0.2   4%   0.0   0   950 6805M  1.9G  2.6G

[lsfadmin@master ~]$ bhosts -l node2

HOST  node2

STATUS           CPUF  JL/U    MAX  NJOBS    RUN  SSUSP  USUSP    RSV DISPATCH_WINDOW

closed_Full     12.50     -     32     30     30      0      0      0      -

 CURRENT LOAD USED FOR SCHEDULING:

           r15s   r1m  r15m    ut    pg    io   ls    it   tmp   swp   mem  slots  ngpus

 Total     0.0   0.0   0.0    4%   0.0    12    0   950 6806M  1.9G  2.6G      0    0.0

 Reserved  0.0   0.0   0.0    0%   0.0     0    0     0    0M    0M    9M      -    0.0

lsb.hosts

在lsb.hosts中,给主机添加如下配置:

Begin Host

HOST_NAME mem

node2 2000/   # 当此节点可用内存达到2000M内存时,就不再往此节点上调度作业。单位可以在lsf.conf中定义;如未定义,默认为M。

node1 2000/

master 2000/

End Host

mem的
  • mem的loadSched只能限制内存资源到了某个阈值不再往该机器上调度作业,但是在该机器上已经运行的作业具体消耗多少mem跟loadSched的限制是没有关系的。
  • mem的loadStop配置是资源剩余不足某个阈值后,挂起作业的
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值