高性能计算中的集体操作与负载均衡策略
在当今数据量飞速增长的时代,高性能计算领域面临着诸多挑战,如数据传输、负载均衡等问题。本文将介绍集体操作在LAM/MPI中的应用,以及一种针对大型只读数据集的负载均衡策略。
集体操作在LAM/MPI中的应用
在高性能集群的基础设施中,高级脚本语言有着独特的应用价值。以Scheme语言为例,它被用于实现LAM/MPI的集体操作模块。基于此,还创建了一个灵活的框架CoMPI,可用于对LAM/MPI中的集体操作进行实验和优化,且无需修改现有应用程序。
在实验中发现,使用CoMPI带来的开销与LAM中的原生集体操作模块相比可以忽略不计。通过重新配置通信模式以匹配实际的网络布局,性能得到了显著提升。
为了更好地理解CoMPI,下面将其与相关工作进行对比:
| 相关工作 | 特点 | 与CoMPI的区别 |
| — | — | — |
| PATHS | 使用Python作为运行时配置语言,采用元组空间系统进行进程间通信 | 不直接使用MPI,而是模拟集体操作的行为 |
| MagPIe | 专为具有广域网连接的多集群设计的MPI实现,集体操作针对长延迟链路进行了优化 | CoMPI的分层映射模仿了MagPIe的非对称算法,但未进行性能比较 |
| Compiled Communication (CC - MPI) | 利用修改后的C编译器在编译时可用的信息来优化集群通信 | 与CoMPI都有尽可能进行静态优化的基本思想,但CC - MPI在应用程序编译时进行,CoMPI在操作首次调用时进行 |
大型只读数据集的负载均衡策略
随着数据仓库规模
超级会员免费看
订阅专栏 解锁全文
565

被折叠的 条评论
为什么被折叠?



