29、CnC - CUDA：用于GPU的声明式编程

最新推荐文章于 2025-07-12 15:49:19 发布

火锅TCP

最新推荐文章于 2025-07-12 15:49:19 发布

阅读量66

点赞数

CC 4.0 BY-SA版权

分类专栏：并行计算语言与编译器的前沿探索文章标签： CnC CUDA GPU

本文链接：https://blog.youkuaiyun.com/r7s8t/article/details/149376305

并行计算语言与编译器的前沿探索专栏收录该内容

34 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

CnC - CUDA：用于GPU的声明式编程

1. 引言

计算机行业正处于硬件发展的重大转折点，数十年来时钟频率指数级增长的趋势已结束。未来的计算机系统预计将采用同构和异构多核处理器，每颗芯片拥有数十到数百个核心，同时配备复杂的硬件设计，以应对并发、能源效率和弹性等挑战。这种向多核计算的转变对软件产生了深远影响，尤其是在那些以往无需考虑多处理器并行性的主流工作负载和应用领域中，软件面临着更大的挑战。

目前，主流桌面系统中出现了使用通用图形处理器单元（GPGPU）来大幅提升性能的趋势。例如，NVIDIA的CUDA已成为一种流行的CPU和GPGPU混合编程模型。然而，对于主流程序员和领域专家来说，编写完整的CUDA应用程序非常复杂，因为涉及到CPU - GPU交互的控制流、数据流和同步等问题，而且调试也十分困难。

为了解决这一混合编程挑战，我们扩展了Intel的并发集合（CnC）编程模型，提出了CnC - CUDA模型。该模型包括为GPU执行定义多线程步骤，以及自动生成CPU步骤和GPU步骤之间的数据和控制流。同时，我们开发了基于Java的CnC实现，为CnC - CUDA的实现奠定了基础。实验结果表明，这种方法在GPU执行和CPU/GPU混合执行中都能带来显著的性能提升。