Torque 的安装

PBS是功能最为齐全,历史最悠久,支持最广泛的本地资源管理器之一。 PBS的目前包括openPBSPBS ProTorque三个主要分支。 其中OpenPBS是最早的PBS系统,目前已经没有太多后续开发,PBS proPBS的商业版本,功能最为丰富。TorqueClustering公司接过了OpenPBS,并给与后续支持的一个开源版本。

环境 

我们这里只用三个节点来做个简单的实验。

Hostname

IP

OS

Needed User

Software

server.torque.com

192.168.254.144

Centos5.2

root    torque

torque-2.4.0b1.tar.gz

node1.torque.com

192.168.254.148

Centos5.2

root    torque

同上

node2.torque.com

192.168.254.149

Centos5.2

root    torque

同上

 

1 我们在三个系统上的/etc/hosts已经写下了如下内容:

192.168.254.144  server.torque.com  server

192.168.254.148  node1.torque.com  node1

192.168.254.149  node2.torque.com  node2

 

2:三个系统上的torque用户,我已经配置了ssh无密码互登陆

torque$ ssh-keygen   生成密钥公钥,将家目录下.ssh/id_rsa.pub拷贝到其它系统上,将其中内容拷贝到authorized_keys.

 

3: torque配置成ssh无密码登陆,主要是用来提交任务。

 

 

安装

 

http://www.clusterresources.com/下载软件。

 

server.torque.com上执行安装配置

使用torque用户解压torque-2.4.0b1.tar.gz

并执行如下命令:

torque$ cd torque-2.4.0b1

torque$ ./configure

torque$ make

 

然后切换到root用户执行

root# make install

 

1 : torque会将一些配置文件安装在/var/spool/torque下。

 

接下来我们切换回torque用户,来生成用于客户端安装的包,即在node1node2上安装的包(前提是,node1node2serverplatform是相同的)

torque$ make packages

 

然后再切换回root用户

[root@server torque-2.4.0b1]# ls -l torque-package-*

-rwxr-xr-x 1 torque torque 441001 Feb 28  2015 torque-package-clients-linux-i686.sh

-rwxr-xr-x 1 torque torque 508149 Feb 28  2015 torque-package-devel-linux-i686.sh

-rwxr-xr-x 1 torque torque 147986 Feb 28  2015 torque-package-doc-linux-i686.sh

-rwxr-xr-x 1 torque torque 540613 Feb 28  2015 torque-package-mom-linux-i686.sh

-rwxr-xr-x 1 torque torque 665571 Feb 28  2015 torque-package-server-linux-i686.sh

 

[root@server torque-2.4.0b1]# ./torque.setup root

 

[root@server torque-2.4.0b1]#cd /var/spool/torque/server_priv

[root@server torque-2.4.0b1]#vi nodes

server.torque.com

node1.torque.com

node2.torque.com

[root@server torque-2.4.0b1]#cd /var/spool/torque/mom_priv

[root@server torque-2.4.0b1]#vi config

$pbsserver  server.torque.com

$logevent 255

 

[root@server torque-2.4.0b1]#pbs_mom -c /var/spool/torque/mom_priv/config

[root@server torque-2.4.0b1]#qterm -t quick

[root@server torque-2.4.0b1]#pbs_server

[root@server torque-2.4.0b1]#pbs_sched

 

 

node1.torque.comnode2.torque.com上执行安装配置

 

1)将上面生成torque-package-mom-linux-i686.shtorque-package-clients-linux-i686.sh拷贝到node1node2上,

root#./torque-package-mom-linux-i686.sh --install

root#./torque-package-clients-linux-i686.sh --install

 

2)如果客户端的架构和服务器端不同,我们需要重新安装,而不是使用上面的两个包,方法如下:

先使用torque用户解压软件包torque-2.4.0b1.tar.gz,然后执行:

torque$ ./configure

torque$ make

 

切换到root用户执行:

root# make install_mom install_clients

 

3)配置

首先检查/var/spool/torque/servername文件,看看内容是否是服务器的名字,不是更正。

 

root# cd /var/spool/torque/mom_priv

root# vi config

$pbsserver  server.torque.com

$logevent 255

 

root# /usr/local/sbin/pbs_mom -c /var/spool/torque/mom_priv/config

 

 

验证

 

我们使用torque登陆到server.torque.com上,

torque$ echo “sleep 30” |qsub

torque$ echo “sleep 30” |qsub

torque$ echo “sleep 30” |qsub

torque$ qstat

 

root# pbsnodes -a

 

通过上面的命令看到了些什么。

### 在Linux系统中安装和配置Torque调度系统的指南 #### 1. 安装依赖项 在开始安装Torque之前,需要确保系统已经安装了必要的依赖项。对于CentOS 7.6,可以通过以下命令安装所需的开发库和工具: ```bash yum install libxml2-devel openssl-devel gcc gcc-c++ boost-devel libtool -y [^1] ``` #### 2. 下载并解压Torque源代码 从官方站点或其他可信来源下载Torque的源代码包,并解压到指定目录: ```bash wget https://github.com/AdrianReber/torque/archive/v4.2.9.tar.gz tar zxvf v4.2.9.tar.gz cd torque-4.2.9 ``` #### 3. 配置和编译Torque 使用`./configure`脚本为系统配置Torque的编译选项,然后执行`make`进行编译: ```bash ./configure --prefix=/usr/local/torque --with-server-home=/var/spool/torque --with-mom-root=/var/spool/torque/mom_priv make make server make mom make client ``` 此步骤将生成服务器端、客户端以及节点管理器(mom)的二进制文件[^1]。 #### 4. 安装Torque 完成编译后,可以使用以下命令将Torque安装到系统中: ```bash make install make install.server make install.mom make install.client ``` #### 5. 配置Munge服务 为了支持节点间的认证,需要安装并启动Munge服务: ```bash sudo yum install munge -y sudo systemctl enable munge sudo systemctl start munge ``` Munge服务是许多集群环境中的必要组件,用于提供安全的消息传递机制[^3]。 #### 6. 配置Torque服务器 编辑`server_name`文件以指定主服务器名称,并确保所有节点都能解析该名称: ```bash echo "master-node-hostname" > /var/spool/torque/server_name ``` 同时,编辑`nodes`文件以添加计算节点列表: ```bash echo "node1 np=8" >> /var/spool/torque/server_priv/nodes echo "node2 np=8" >> /var/spool/torque/server_priv/nodes ``` 此处的`np=8`表示每个节点有8个可用处理器核心。 #### 7. 启动Torque服务 在主服务器上启动PBS调度服务: ```bash pbs_server -t create pbs_mom pbs_sched ``` 验证服务是否正常运行: ```bash pbsnodes -a ``` 如果显示“Server has no node list”,则需要检查`server_priv/nodes`文件是否正确配置。 #### 8. 测试作业提交 创建一个简单的测试脚本`test.pbs`,并提交到队列中: ```bash #PBS -N TestJob #PBS -l nodes=1:ppn=1 #PBS -j oe #PBS -o output.log echo "Running on host: `hostname`" sleep 60 ``` 使用以下命令提交作业: ```bash qsub test.pbs ``` 查看作业状态: ```bash qstat ``` #### 9. 集成MATLAB Parallel Server(可选) 如果计划在集群中运行MATLAB任务,需按照MATLAB Parallel Server的文档创建集群配置文件,并确保其与Torque集成[^2]。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值