并行计算集群系统

其实,这个标题好搞笑……

集群系统

一个能正常工作的基于Linux系统的并行计算集群,应该具备以下的特征。

  1. 有一个调度器,比如Slurm,OpenPBS等。商用的就不提了。
  2. 运行同一个版本的Linux系统,也就是系统版本唯一。
  3. 用户信息唯一和数据唯一。意味着用户在任何一个节点上,看到的数据程序都是一样的。
  4. 除了登录环节外,用户通过调度器访问任何资源,鉴权过程均是无感知的。
  5. 用户仅可访问调度器分派的资源。依靠用户自觉遵守规则,不盗用资源是不现实的。
  6. 添加和删除用户,只需在管理节点完成类似useradd/userdel的操作。
  7. 关机,开机,重启某一个机器或者整个集群,只需在管理节点操作一次。任何实际过程,均不直接操作任何一个计算节点。

别迷信术语/行话

别迷信什么并行环境。这种专业的术语都是糊弄人的。

科学计算中的并行计算,就我接触到的而言,绝大多数是通过MPI进行的。

调度器自动传递参数给MPI,然后程序自动通过MPI并行。不用额外搞什么环境的。

当然了,程序代码本身决定了支持那种MPI(比如MPICH和OpenMPI),以及能否通过MPI并行。有些程序还是通过OpenMP方式并行的。

不支持MPI的程序,当然不可以通过mpirun来运行了。

未必需要MPI

如果采用hpc4you的集群方案,MPI都不需要。

使用hpc4you_toolkit完成集群搭建之后,下载

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值