kaldi中sge集群的使用

Kaldi训练的并行化需要配置cmd.sh。在本地机器上只需设置train_cmd、decode_cmd、mkgraph_cmd和cuda_cmd为"utils/run.pl"。然而,在SGE集群上,需要指定queue,例如通过"queue.pl -q $queue"。可以使用qconf -sql查看所有队列,如all.q、c.q和gpu.q。要创建或管理队列,可以使用qconf的一系列命令,如添加、清除、删除或修改队列配置。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

kaldi训练的并行化需要配置cmd.sh
如果是local machine,只需要设置

export train_cmd=”utils/run.pl”
export decode_cmd=”utils/run.pl”
export mkgraph_cmd=”utils/run.pl”
export cuda_cmd=”utils/run.pl”

如果使用sge集群,则需要制定所使用的sge集群的queue。如:

export train_cmd=”queue.pl -q $queue”

使用qconf -sql 可以查看当前sge所包含的queue

qconf -sql:
all.q(一般all.q 会包含所有的主机)
c.q
gpu.q

若使用all.q,cmd 可设置为export train_cmd=”queue.pl -q all.q”.

如果想在当前的sge中再新建一个queue,包含若干主机。可使用以下的命令进行相关的操作:

qconf -aq [ 队列名]
添加队列, 此命令启动一个编辑器,其中显示队列配置模板。如果提供可选参数队列名,则此队列的配置将用作模板。可通过更改模板并将其保存至磁盘来配置队列。
qconf -Aq 文件名
添加队列,用文件文件名来定义一个队列。
qconf -cq 队列名[,…]
清除队列?? 清除指定队列的状态,使之闲置,停止运行作业。状态复位,且不考虑当前状态。该选项对于排除错误情形很有用,但不宜在常规操作模式下使用。
配置队列
qconf -dq 队列名[,…]
删除队列, 从可用队列列表中删除自变量列表中指定的队列。
qconf -mq 队列名
修改队列, 修改指定的队列。启动一个编辑器环境变量对应的编辑器),其

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值