台式计算机运行fdtd配置,基于CPU-GPU 异构机群的FDTD 并行算法加速研究（三）...

最新推荐文章于 2025-04-10 11:02:20 发布

oniT Tino

最新推荐文章于 2025-04-10 11:02:20 发布

阅读量2.7k

点赞数

文章标签：台式计算机运行fdtd配置

该研究对比分析了基于CPU、MPI、OpenCL和CUDA的FDTD程序，实验显示在GPU上运行的OpenCL和CUDA程序相对于CPU有显著加速，特别是对于高计算密度的函数。在LARGE数据集上，多GPU扩展性能良好，展现出GPU在FDTD计算中的潜力。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

相关资料：

3 测试结果与分析

实验平台包括 HD5870 GPU、Tesla C2050 GPU

和IntelXeon X5650 处理器机群，其主要的处理器体系结构参数如表3

所示。实验中所使用的数据集与第二节分析程序中的数据一致，如表1 所示。

为了实验的对比分析，我们实现了4 个版本的FDTD程序：CPU 上执行的FDTD-serial 串行程序、多核CPU

上执行的FDTD-MPI 并行程序、ATI GPU 上执行的FDTDOpenCL加速程序和NVIDIA GPU

上执行的FDTD-CUDA加速程序。目前而言，单精度计算可以满足所测试FDTD实验场景的需求，所以不开启OpenCL

的双精度浮点运算支持。评价总体性能的标准为GPU 版相对CPU 版的加速比，计算公式为CPU 执行时间/GPU

执行时间。

3.1 GPU 加速分析

图 7 显示FDTD 在SMALL 数据集下，在1 个CPU 核、4 个CPU 核、8 个CPU

核、Tesla C2050 GPU 和HD5870 GPU下计算时间对比。多CPU 核使用MPI 调度数据，GPU

加速代码为OpenCL.由图可见，在SMALL 数据集下，使用HD5870,OpenCL 加速相对CPU

加速比可达到8.11,且性能比8 个CPU 的MPI 加速性能还要好。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。