并行FFT与Eden骨架及广义牛顿法求解大规模线性规划问题
1. 并行FFT与Eden骨架
在并行FFT的实现中,有多种方法和骨架可供选择。不同的方法在运行时间和通信开销上存在差异。
1.1 不同扩展方式的FFT运行时间对比
扩展方式 | 频率抽取 | 时间抽取 |
---|---|---|
分布式扩展运行时间 | 24.80 s | 17.85 s |
扁平扩展运行时间 | 6.92 s | 7.78 s |
从表格数据可以看出,频率抽取的扁平扩展版本是最快的,运行时间仅为6.92 s。这是因为主进程中的后处理可以非常快速地完成,结果合并只是简单的洗牌操作。而时间抽取版本的顶层合并阶段几乎占据了总运行时间的四分之三。
使用扁平扩展骨架可以消除输入通信,即任务分配给工作进程的过程。每个工作进程接收整个未评估的任务规范,并按需评估自己的部分。相反,分布式扩展骨架的工作分配较慢,因为主进程将任务分配给所有工作进程,这些进程最初会阻塞等待任务,并在不同的时间点开始工作,导致运行时间行为不均匀。
1.2 高级FFT算法
为了提高并行FFT在更多处理器上的扩展性,采用了一种更复杂的算法。该算法将输入向量划分为边长为 $l = 2^k$ 的