并行二维FFT与网格计算资源发现机制的研究与实践
并行二维FFT实现
在多核处理器上利用英特尔AVX指令实现并行二维FFT是一项具有重要意义的工作。通过对FFT内核进行矢量化以及利用OpenMP对块二维FFT进行并行化,能够在处理较大问题规模时仍保持较高的性能,这得益于缓存分块技术的应用。
不同基数FFT内核的内循环操作
| 基数 | 加载操作 | 存储操作 | 乘法操作 | 加法操作 | 字节/浮点运算比 |
|---|---|---|---|---|---|
| 2 | 4 | 4 | 4 | 6 | 6.400 |
| 4 | 8 | 8 | 12 | 22 | 3.765 |
| 8 | 16 | 16 | 32 | 66 | 2.612 |
从这个表格可以看出,随着基数的增大,各项操作的数量和字节/浮点运算比都有相应的变化。加载和存储操作数
超级会员免费看
订阅专栏 解锁全文
51

被折叠的 条评论
为什么被折叠?



