MPI
文章目录
$1 概述
参考老师PPT,加粗部分即为重点内容。
MPI是一个跨语言(编程语言如C, Fortran等)的通讯协议,用于编写并行计算机。支持点对点和广播。MPI是一个信息传递应用程序接口,包括协议和和语义说明,他们指明其如何在各种实现中发挥其特性。MPI的目标是高性能,大规模性,和可移植性。MPI在今天仍为高性能计算的主要模型。与OpenMP并行程序不同,MPI是一种基于信息传递的并行编程技术。消息传递接口是一种编程接口标准,而不是一种具体的编程语言。简而言之,MPI标准定义了一组具有可移植性的编程接口。
Ref.:
MPI Tutorial Introduction - Wes Kendall
$2 MPI基本函数
MPI调用接口的总数虽然庞大, 但根据实际编写MPI的经验, 常用的MPI调用的个数却十分有限。
下面是6个最基本的MPI函数。
- MPI_Init(…);
- MPI_Comm_size(…);
- MPI_Comm_rank(…);
- MPI_Send(…);
- MPI_Recv(…);
- MPI_Finalize();
$2.1 MPI_Init(int* argc, char** argv[])
- 该函数通常应该是第一个被调用的MPI函数用于并行环境初始化,其后面的代码到 **MPI_Finalize()**函数之前的代码在每个进程中都会被执行一次。
- 除**MPI_Initialized()**外, 其余所有的MPI函数应该在其后被调用。
- MPI系统将通过argc, argv得到命令行参数(也就是说main函数必须带参数,否则会出错)。
$2.2 MPI_Finalize(void)
- 退出MPI系统, 所有进程正常退出都必须调用。 表明并行代码的结束,结束所有子进程。
- 串行代码仍可在主进程(rank = 0)上运行, 但不能再有MPI函数(包括MPI_Init())。
$2.3 MPI_Comm_size(MPI_Comm comm, int* size )
- 获得进程个数 size。
- 指定一个通信子,也指定了一组共享该空间的进程, 这些进程组成该通信子的group(组)。
- 获得通信子comm中规定的group包含的进程的数量。
$2.4 MPI_Comm_rank (MPI_Comm comm, int* rank)
- 得到本进程在通信空间中的rank值,即在组中的逻辑编号(该 rank值为0到p-1间的整数,相当于进程的ID。
$2.5 MPI_Send(...)
int MPI_Send(void *buff, int count, MPI_Datatype datatype, // 消息数据
int dest, int tag, MPI_Comm comm) // 消息信封
- void *buff:发送缓冲区。
- int count:要发送的消息个数(注意:不是长度,例如你要发送一个int整数,这里就填写1,如要是发送“hello”字符串,这里就填写6(C语言中字符串未有一个结束符,需要多一位))。
- MPI_Datatype datatype:要发送的数据类型,这里需要用MPI定义的数据类型,可在网上找到,在此不再罗列。
- int dest:目的地进程号,你要发送给哪个进程,就填写目的进程的进程号。
- int tag:消息标签,接收方需要有相同的消息标签才能接收该消息。
- MPI_Comm comm:通讯域。表示你要向哪个组发送消息。
$2.6 MPI_Recv(...)
int MPI_Recv(void *buff, int count, MPI_Datatype datatype,
int source, int tag, MPI_Comm comm,
MPI_Status *status)
- void *buff:接收缓冲区。
- int count:接收数据长度的上界。具体接收到的长度可通过调用
MPI_Get_count
函数得到。 - MPI_Datatype datatype:你要接收的数据类型,这里需要用MPI定义的数据类型,可在网上找到,在此不再罗列。
- int dest:接收端进程号,你要需要哪个进程接收消息就填写接收进程的进程号。
- int tag:消息标签,需要与发送方的tag值相同的消息标签才能接收该消息。
- MPI_Comm comm:通讯域。
- MPI_Status *status:消息状态。接收函数返回时,将在这个参数指示的变量中存放实际接收消息的状态信息,包括消息的源进程标识,消息标签,包含的数据项个数等
$3 MPI消息数据类型
$3.1 定义
每个MPI消息都有相应的数据类型,MPI通过引入消息数据类型来解决消息传递过程中的异构性问题以及数据不连续问题。MPI的消息数据类型可以分为两种: 预定义数据类型 和 派生数据类型 (Derived Data Ty