68、HyGrid：高效的CPU - GPU混合网格算法

算法笑匠

于 2025-10-17 16:28:55 发布

阅读量19

点赞数

CC 4.0 BY-SA版权

分类专栏：并行计算前沿探索文章标签： HyGrid GPU加速 CPU-GPU混合

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/1a2s3d4f5g/article/details/153556544

并行计算前沿探索专栏收录该内容

70 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

HyGrid：高效的CPU - GPU混合网格算法

1 相关工作回顾

在基于卷积的网格划分领域，先前的研究主要集中在三个方面：基于GPU的散射、预排序和聚集，以及优化策略。

1.1 基于GPU的散射

Van Amesfoort方法 ：为每个输入点分配一个小的私有网格，从根本上避免了数据竞争。但它限制了输出网格的分辨率，不适用于最新的大型射电望远镜。
Humphreys和Cornwell方法 ：基于内存复制，为澳大利亚平方公里阵列探路者（ASKAP）在GPU上实现了散射。
Romein方法 ：设计了另一种基于GPU的散射，通过让线程在寄存器中尽可能长时间地累积加权和，减少设备内存访问。
Merry方法 ：使用线程粗化改进了Romein的算法，显著降低了设备内存的寻址开销。不过，这两种方法严重依赖干涉仪数据的空间相干性，不适用于单碟望远镜。

1.2 预排序和聚集

Edgar方法 ：为Murchison宽场阵列（MWA）在GPU上设计了聚集，使用Thrust对输入点进行预排序。但粗粒度的分箱策略导致大量不必要的内存寻址开销和卷积计算。
Gai方法 ：通过紧凑分箱方法对磁共振成像数据进行预排序，实现了聚集。
Winkel方法

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。