背景
mpirun 是 OpenMPI 的一个工具,用于启动并行程序。它负责启动多个进程,并在这些进程之间建立通信。mpirun常见参数记录。
- MPI 是 Message Passing Interface ,“消息传递接口”。MPI 是一种标准化的并行计算通信协议,用于在分布式内存系统中实现进程间通信。它允许开发者编写可扩展的并行程序,这些程序可以在多台计算机(或多个进程)之间高效地传递数据。
- MPI 是一个标准协议,有多种实现,常见的包括:
MPICH:一个开源的 MPI 实现,广泛用于学术和研究领域。
OpenMPI:另一个流行的开源 MPI 实现,支持多种通信后端(如 TCP、InfiniBand 等)。
Intel MPI:由英特尔提供的高性能 MPI 实现,优化了英特尔硬件。
MVAPICH:针对 InfiniBand 和其他高性能网络优化的 MPI 实现。- mpirun 是 MPI 实现中的一个工具,用于启动并行程序。它负责:
- 启动多个进程。(-np)
- 配置进程间的通信环境。(NCCL_xxx=xxx)
- 管理进程的执行和同步。
常见参数
一条简单命令:mpirun -np 2 --allow-run-as-root --mca btl openib,self,vader --mca btl_openib_if_include mlx5_0,mlx5_1 --mca btl_openib_cpc_include rdmacm -x NCCL_SOCKET_IFNAME=enp1s0f0 ./build/all_reduce_perf -b 8 -e 128M -f 2 -g 1 -c 0
-np: N

最低0.47元/天 解锁文章
1036

被折叠的 条评论
为什么被折叠?



