pbs子节点为free,但queue为Q的几种可能解决方法

本文详细介绍了在调度系统中遇到任务无法提交的问题时,如何通过使用root用户和普通用户登录子节点、删除旧任务、调整服务器设置、以及清理无效节点等方法来解决这一常见难题。特别强调了在重新提交任务前确保所有可用节点已与主节点建立连接的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

经常出现这种情况,明明子节点是free的,但就是提交不了任务。
可能解决方法:
一:用root用户和普通用户(提交作业的普通用户)从主节点用ssh登录各子节点。防止主节点没有登录节点的权限。
二:qdel all 然后  qterm -t immediate 然后 pbs_server,如果之前的任务还在,那就等等或者重复几次,一直到qstat没有任何东西为止。不过在重新提交任务之前,一定要确定所有的可用节点都已经和主节点取得联系,可以用qnodes -l free查看一下。
三:qmgr -c 'set server node_pack = False' 意思是利用最可能多的节点进行计算,而不是都堆在前面几个节点。然后 qterm -t immediate 然后 pbs_server。
四:在/var/spool/torque/server_priv/nodes中,将down的节点注释掉。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值