
MPI
runzhliu
毕业于中山大学,目前专注于容器和大规模并行计算
展开
-
openmpi超过50个节点的无法运行
之前在测试 openmpi 4.0.0 的时候,发现超过50个节点就无法运行,经过测试验证,在 4.0.3 版本是可以的,用户可以升级一下。Referencehttps://github.com/open-mpi/ompi/issues/6691https://github.com/open-mpi/ompi/issues/6618https://github.com/open-mpi/ompi/pull/6714...原创 2020-06-15 10:36:09 · 479 阅读 · 0 评论 -
遇到mpi worker exited on signal 9
运行一个 mpi-operator 的 demo(这个 demo 还是我提交的…),看到如下错误。An MPI communication peer process has unexpectedly disconnected. Thisusually indicates a failure in the peer process (e.g., a crash orotherwise exiting without calling MPI_FINALIZE first).Although this原创 2020-06-09 10:52:50 · 3264 阅读 · 2 评论 -
MPI on Kubernetes
MPI(Message Passing Interface) 是一种可以支持点对点和广播的通信协议,具体实现的库有很多,使用比较流行的包括 Open Mpi, Intel MPI 等等,关于这些 MPI 库的介绍和使用,本文就不多赘述了,各位可以看看官方文档。mpi-operator 是 Kubeflow 社区贡献的另一个关于深度/机器学习的一个 Operator,关于 mpi-operator...原创 2020-04-12 20:04:00 · 1857 阅读 · 3 评论 -
Gustafson 定律
文章目录OverviewIntroductionSummaryReferenceOverviewGustafson 定律(Gustafson’s law)阐述了数据并行带来的影响。Gustafson 定律是由 John L. Gustafson 在1988年提出的。是并行计算领域除了 Amdahl 定律之后又一个重要定律。IntroductionAmdahl 定律有一个重要前提,就是处理的...原创 2020-02-18 22:19:29 · 2732 阅读 · 0 评论 -
Amdahl定律
文章目录OverviewIntroductionReferenceOverviewAmdahl 定律(Amdahl’s law)是并行计算领略一个非常著名的定律。由 Gene Amdahl 于1967年提出。Amdahl 定律描述的是数据规模固定时,渐进加速比的变化趋势。Time=s+fpTime = s + \frac{f}{p} Time=s+pfsss 串行部分fff 并行部分...原创 2020-02-17 23:45:58 · 1937 阅读 · 0 评论