VMware+Ubuntu环境安装配置SLURM

本文详细记录了在VMware虚拟机中迁移Ubuntu,以及后续在Ubuntu上配置SSH、安装MUNGE和SLURM的过程。通过源码编译安装SLURM时遇到了符号查找错误,最终通过安装libmunge-dev解决问题,成功运行SLURM。

故事背景忽略不计以免被鄙视。


VMware是常见的虚拟机软件,这就不多说了。安装ubuntu也很简单,装上就完了。

VMware虚拟机的迁移

许多虚拟机软件都支持将虚拟机文件在其他地方重用。比如VirtualBox和ParalellDesktop的虚拟机本身就是一个文件,直接拷贝就好了。但是VMware默认建立的虚拟机是一个文件夹里面有一堆文件。首先要导出虚拟机到一个文件中。File->Export to OVF。然后就生成几个文件,其中有一个很小的OVF文件和一个很大的虚拟磁盘文件,还有一个配置文件吧。。。把它们放在一个文件夹中就可以随便复制粘贴了。导入虚拟机的时候直接双击那个OVF文件即可。

Ubuntu中ssh环境的配置

ssh客户端是默认安装的,但是服务端可能要手动安装

sudo apt-get openssh-server

完成之后看

ps -e | grep ssh

看ssh-agent和sshd是否出现,出现的话就说明启动成功,其他节点就可以访问这台ubuntu了。

Ubuntu中MUNGE的安装

SLURM需要一个用作安全管理的插件,MUNGE是其中的一种。安装配置说简单也简单,但是我的英文不好,所以看guide的时候理解错了(好桑心啊)

MUNGE的安装指南

总之就是先装上,然后把各个文件夹的权限按要求改了。还要把文件夹的owne

### 在Ubuntu单节点上安装配置Slurm调度系统 在Ubuntu单节点上安装配置SLURM调度系统,可以按照以下内容进行操作。SLURM(Simple Linux Utility for Resource Management)是一个开源的集群管理和作业调度系统,适用于Linux环境下的计算资源管理[^1]。 #### 1. 安装依赖包 首先需要确保系统中已安装必要的依赖包。执行以下命令以安装这些依赖项: ```bash sudo apt update sudo apt install -y wget gcc make munge libmunge-dev openssl libssl-dev ``` #### 2. 下载并编译SLURM源码 从官方源获取最新版本的SLURM源码,并进行编译安装: ```bash wget https://download.schedmd.com/slurm/slurm-23.02.0.tar.bz2 tar -xjf slurm-23.02.0.tar.bz2 cd slurm-23.02.0 ./configure --prefix=/usr/local/globle/softs/slurm/16.05.3 make sudo make install ``` #### 3. 配置MUNGE服务 SLURM依赖于MUNGE进行身份验证。配置MUNGE服务以确保安全通信: ```bash sudo mkdir -p /etc/munge /var/run/munge sudo chown munge: /etc/munge /var/run/munge sudo systemctl enable munge sudo systemctl start munge ``` #### 4. 复制示例配置文件 将SLURM提供的示例配置文件复制到适当位置,并根据需求进行修改: ```bash sudo cp etc/slurm.conf.example etc/cgroup.conf.example etc/slurmdbd.conf.example /usr/local/globle/softs/slurm/16.05.3/etc/ ``` 此步骤参考了相关文档中的说明[^2]。 #### 5. 编辑`slurm.conf`文件 编辑`/usr/local/globle/softs/slurm/16.05.3/etc/slurm.conf`文件,定义ClusterName、NodeName、Partition等参数。例如: ```bash ClusterName=ubuntu-cluster ControlMachine=localhost NodeName=localhost NodeAddr=127.0.0.1 State=UNKNOWN PartitionName=debug Nodes=localhost Default=YES MaxTime=INFINITE State=UP ``` #### 6. 启动SLURM服务 启动SLURM控制器和守护进程: ```bash sudo scontrol ping sudo slurmd sudo slurmctld ``` #### 7. 测试SLURM功能 使用`sinfo`命令检查节点状态,确保SLURM正常运行: ```bash sinfo ``` 如果一切配置正确,您应该能够看到节点处于空闲状态。 ```python # 示例:提交一个简单的测试任务 echo "sleep 60" | sbatch ``` ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值