6、OpenSHMEM over MPI：性能分析与优化策略

最新推荐文章于 2025-07-08 12:10:25 发布

rgv23456789

最新推荐文章于 2025-07-08 12:10:25 发布

阅读量8

点赞数

CC 4.0 BY-SA版权

分类专栏： OpenSHMEM在Exascale时代的应用与优化文章标签： OpenSHMEM MPI 性能分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/rgv23456789/article/details/149535942

OpenSHMEM在Exascale时代的应用与优化专栏收录该内容

22 篇文章 ¥399.00 ¥499.90

订阅专栏

超级会员免费看

OpenSHMEM over MPI：性能分析与优化策略

1. 引言

在并行计算领域，OpenSHMEM 和 MPI 是两种常用的编程模型。本文聚焦于 OpenSHMEM 基于 MPI 实现时的性能问题，分析了连续远程内存访问（RMA）操作中的性能损失，并提出了相应的优化策略。

2. 性能损失分析

2.1 分析基础

本次分析基于 OSHMPI - 2.0b1 和 MPICH - 3.35 版本，以 SOS 1.4.2 作为原生实现的代表进行对比。采用基本的延迟场景，即一个进程执行 shmem_putmem 后调用 shmem_quiet 到远程进程。

2.2 shmem_putmem 分析

原生实现 ：以 SOS 为例， shmem_putmem 通常只需几个内部步骤，如准备 OFI 写参数并调用 ofi_inject_write 或 ofi_write ，然后等待本地写操作完成。
OSHMPI/MPICH 实现 ：涉及多个额外步骤，可分为三个阶段：
- 阶段 1：MPI 参数准备 ：将目标缓冲区地址转换为对应的窗口句柄和相对位移。
- 阶段 2：MPI Put ：
  1. 获取窗口句柄的内部

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。