P系统在GPU和FPGA上的实现
1. P系统在GPU上的实现
GPU已成为大规模并行处理器和一种使能技术,程序员可以利用它加速科学应用。由于GPU和P系统都具有双重并行性,GPU为模拟P系统提供了良好的并行平台,其共享内存系统也有助于高效同步模型的模拟。此外,它是一种廉价且可扩展的并行架构,在当前的高性能计算解决方案中可见。
1.1 GPU模拟P系统的性能
- 对于小型基础模型,GPU的速度稍慢(高于0.9倍)。
- 对于较大的模型,加速比更高。当模拟2000个物种时,自适应和通用模拟器的加速比分别约为30倍和50倍。
- 当模拟数百个物种时,自适应和通用版本分别获得6倍和10倍的加速。
- 使用自适应版本时,GPU的加速比更低,因为模块化方案对CPU的影响比对GPU更好。使用P100 GPU时,这种设计额外提高了2.5倍的性能。
| 模型规模 | 自适应模拟器加速比 | 通用模拟器加速比 |
|---|---|---|
| 小型基础模型 | 高于0.9倍 | 高于0.9倍 |
| 2000个物种 | 约30倍 | 约50倍 |
| 数百个物种 | 6倍 | 10倍 |
超级会员免费看
订阅专栏 解锁全文
30

被折叠的 条评论
为什么被折叠?



