数值树代码并行化与稀疏矩阵哈希组装的高效方法
数值树代码并行化
在数值树代码的并行化过程中,树和交互列表的构建可能会带来高效且正确的结果。不过,自动并行化存在一定局限性。比如,为保证正确性需要进行一些消息传递,但过多的消息传递会耗尽本地内存并降低并行效率。
为解决这一问题,可在应用程序中添加额外提示(代码注释)。该提示提供了一个选择节点集的标准,能选出最需要的节点。转换后的代码会启动消息传递步骤,以交换由依赖分析确定的变量。只有当给定标准能匹配某个处理器的任何节点时,节点的数据才会被发送到另一个处理器。因此,该标准必须具有传递性,即如果它对某对节点中的一个子节点和另一个节点成立,那么对这对节点也成立。相关代码如下:
REQUIRE(list<tree*> neighbor, fetch);
REQUIRE(list<tree*> inter, fetch);
int fetch(tree *b) { return (distance(b) <= 2 * fmin(diam, b->diam)); }
为了实现生成式编程和用领域语言编写的代码的自动并行化概念,需要实现几个系统:
1. 创建数据依赖分析工具和代码生成系统。
2. 编写领域语言和并行应用库。
3. 开发一个用领域语言编写并由代码生成系统编译的示例应用代码。
目前,数据依赖分析的主要部分实现方式不够稳健,导致推测性并行化。代码的树原子在不同设置下进行编译和实例化。运行时系统会跟踪所有对变量的引用,从而实现能够进行过程间分析和递归调用的依赖分析。
超级会员免费看
订阅专栏 解锁全文
14

被折叠的 条评论
为什么被折叠?



