超级计算LSF作业调度系统(web界面集群管理)

简介:LSF机群作业管理系统是曙光公司自己的一套作业管理系统,采用B/S架构,直接在网页管理界面就可以管理整个作业和作业节点;

1 LSF常用作业管理命令:

作业提交bsub

查看自己运行的所有作业的情况bjobs

跟踪某任务屏幕输出bpeek

bkill 杀死某个作业

bqueues作业队列情况

bstop停止挂起作业

bresume 恢复挂起作业

lshost查看节点信息

bhosts查看所有节点作业信息

lshosts查看所有节点负载信息

busers 查看用户最大可用核心以及用户作业情况,比如busers  hubo.huang(hubo.huang是用户名)

 

作业脚本范例:

计算任务是通过脚本文件提交到作业管理系统的(也即是在pac管理平台提交,pac管理平台有作业脚本范例),脚本文件是一个可执行文件;

脚本参数说明:

1作业要使用的队列 2作业需要的核心数 3每节点分配给作业运行的核心数 

lsf一般有主节点,和从节点,防止作业管理单点故障;

 

转载于:https://www.cnblogs.com/wangnengwu/p/5685141.html

《国科大lsf作业调度系统和超算队列介绍.pdf》是对国家科学技术大学(以下简称国科大)的作业调度系统和超算队列进行介绍的文件。 国科大的作业调度系统采用了IBM的Load Sharing Facility(LSF)软件,LSF是一个高性能计算环境下广泛使用的作业调度和管理系统。LSF能够根据用户提交的作业和集群资源的情况自动进行作业调度和管理,以提高作业的执行效率和集群的利用率。该系统能够有效地分配和管理集群的资源,提高超算的计算能力,满足用户的需求。 超算队列是指国科大超级计算中心按照一定规则和算法对用户提交的作业进行分配和排队的方式。超算队列能够根据作业的优先级、资源要求等进行作业排序和调度,以保证高优先级作业和重要计算任务的优先执行。通过合理设置和使用超算队列,国科大能够充分利用超级计算资源,提高计算效率和资源利用率。 该文件介绍了国科大的LSF作业调度系统的原理和功能,包括作业的提交和管理、资源的分配和调度等内容。同时也详细介绍了国科大超算队列的设置和调度策略,包括作业排队和优先级排序的算法、资源利用率的监控和统计等内容。 通过《国科大lsf作业调度系统和超算队列介绍.pdf》的阅读,用户可以了解国科大高性能计算环境下的作业调度和管理机制,以及超算队列的设置和调度策略。这有助于用户更好地使用国科大的超级计算资源,优化作业的执行效率和集群的资源利用率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值