1、# PBS_Server: Resource temporarily unavailable (11) in PBS_Server
出错的原因一般是server_name与mom设置的name不一致,修改server_name与mom一致即可。
server_name文件在PBS或torque的目录下。如果用rpm包安装的torque, 可以用下面的命令查询
rpm -ql torque
2、# qsub: Job exceeds queue resource limits MSG=cannot locate feasible nodes
在提交作业时候,如果PBS没有计算节点,就会出现这个错误。也可以用
pbsnodes
来查看PBS的节点。如果没有任何输出结果,说明需要设置计算节点。编辑文件
vim $PBS_HOME/server_priv/nodes
加入类似的节点,如
node001 np=2
重启PBS服务。
3、# mpiexec: cannot connect to local mpd
原因是PBS脚本没有启动mpd。启动mpd的简单方法是
cat $PBS_NODEFILE
NCPU=`wc -l < $PBS_NODEFILE`
NNODES=`uniq $PBS_NODEFILE | wc -l`
mpdboot -n ${NNODES} -f ${PBS_NODEFILE} -v --remcons
mpiexec -np $NCPU hostname
mpdallexit
PBS/torque常见错误[转]
最新推荐文章于 2024-06-25 13:29:21 发布