qsub 笔记

使用qlogin解决GPU节点访问问题

1. 之前有的节点访问不了,查看节点GPU负载得写脚本再qsub,后来看qsub manual的时候发现有个qlogin,试了一下发现ssh跳转不了的节点,可以用

qlogin -l hostname=nodename

直接跳转,之后GPU节点之间可以用ssh跳转。

2. 待续

### qsub 指令的使用方法 `qsub` 是一个用于在高性能计算(HPC)集群中提交作业的命令,通常与调度系统如 PBS(Portable Batch System)或 Torque 结合使用。它允许用户定义作业的资源需求、执行环境以及任务的具体内容。 以下是 `qsub` 的基本语法和常用选项: ```bash qsub [options] script_file ``` - **基本选项**: - `-l`: 指定作业所需的资源限制,例如 CPU 时间、内存等[^4]。 - `-N`: 指定作业名称。 - `-o`: 指定标准输出文件路径。 - `-e`: 指定标准错误输出文件路径。 - `-q`: 指定作业提交的队列名称。 - `-M`: 指定接收作业状态通知的电子邮件地址。 - `-m`: 指定何时发送邮件通知(`a` 表示作业终止时,`b` 表示作业开始时,`e` 表示作业结束时)。 ### 示例用法 以下是一个完整的 `qsub` 命令示例,展示了如何提交一个简单的作业脚本: ```bash qsub -l nodes=1:ppn=2,walltime=1:00:00 -N my_job -o output.log -e error.log my_script.sh ``` 此命令的作用是提交名为 `my_script.sh` 的脚本到集群中运行,并指定以下参数: - 使用 1 个节点,每个节点分配 2 个处理器核心。 - 最大运行时间为 1 小时。 - 输出日志保存到 `output.log` 文件中。 - 错误日志保存到 `error.log` 文件中。 ### 参数说明 - **-l**: 定义资源需求,例如节点数、处理器数、内存大小和运行时间限制。格式为 `nodes=X:ppn=Y,mem=Zgb,walltime=H:M:S`[^4]。 - **-N**: 为作业指定一个易于识别的名称。 - **-o** 和 **-e**: 分别指定标准输出和标准错误的保存位置。 - **-q**: 指定作业提交的目标队列名称。 - **-M**: 提供接收作业状态更新的电子邮件地址。 - **-m**: 定义邮件通知的时间点。 ### 脚本示例 以下是一个简单的作业脚本示例,包含必要的头部信息和执行命令: ```bash #!/bin/bash #PBS -l nodes=1:ppn=2,walltime=2:00:00 #PBS -N example_job #PBS -o output.log #PBS -e error.log cd $PBS_O_WORKDIR echo "Job started on `hostname` at `date`" sleep 60 echo "Job ended at `date`" ``` 此脚本的功能包括: - 设置资源需求和作业名称。 - 记录作业的启动时间和结束时间。 - 在作业运行期间暂停 60 秒以模拟任务执行。 ### 注意事项 1. 在提交作业前,确保脚本中的路径和环境变量设置正确。 2. 如果需要监控作业状态,可以使用 `qstat` 命令查看当前队列中的作业信息[^4]。 3. 为了优化资源利用率,合理设置 `-l` 参数中的资源需求是非常重要的。 ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值