3D B样条函数并行积分与静息态脑功能连接分析
3D B样条函数并行积分
在实际实现中,通过构建三个不同的循环组和多个缓冲区,使得和因子分解相关的计算成本降低到了 $O(p^7)$。
积分并发模型
对于两种算法,采用了相同的方法。引入了四种基本的计算任务:
1. 计算任务,用于评估元素 $E_α$ 在求积点坐标处的一维基函数。
2. 计算任务,用于评估元素 $E_α$ 在求积点坐标处的三维基函数。
3. 计算任务,用于评估元素 $E_α$ 在求积点处两个基函数(来自测试空间和试验空间)乘积的值。
4. 计算任务,用于评估元素 $E_α$ 上两个基函数(来自测试空间和试验空间)标量积的积分值。
接着定义了任务字母表 $\Sigma$ 和它们之间的依赖关系集合 $D$。同时将该方法应用于和因子分解算法,以从迹理论方法中获得最优调度和理论验证。随后进行了一系列数值实验来测量并行性能。
所有在福阿塔范式(Foata Normal Form)各层中提到的任务都旨在在同质架构上执行。特定福阿塔类中的所有任务应该花费几乎相同的时间,并且可以作为一个公共包进行有效调度。这种方法对于大型集群(如每个计算节点配备多个 GPU 的现代超级计算机)的实际实现非常有用。
结果
| 算法 | 串行时间($t_{serial}$) | OpenMP 时间($t_{OpenMP}$) | GPU 时间($t_{GPU}$) |
|---|
超级会员免费看
订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



