HyGrid:高效的CPU - GPU混合网格算法
1 相关工作回顾
在基于卷积的网格划分领域,先前的研究主要集中在三个方面:基于GPU的散射、预排序和聚集,以及优化策略。
1.1 基于GPU的散射
- Van Amesfoort方法 :为每个输入点分配一个小的私有网格,从根本上避免了数据竞争。但它限制了输出网格的分辨率,不适用于最新的大型射电望远镜。
- Humphreys和Cornwell方法 :基于内存复制,为澳大利亚平方公里阵列探路者(ASKAP)在GPU上实现了散射。
- Romein方法 :设计了另一种基于GPU的散射,通过让线程在寄存器中尽可能长时间地累积加权和,减少设备内存访问。
- Merry方法 :使用线程粗化改进了Romein的算法,显著降低了设备内存的寻址开销。不过,这两种方法严重依赖干涉仪数据的空间相干性,不适用于单碟望远镜。
1.2 预排序和聚集
- Edgar方法 :为Murchison宽场阵列(MWA)在GPU上设计了聚集,使用Thrust对输入点进行预排序。但粗粒度的分箱策略导致大量不必要的内存寻址开销和卷积计算。
- Gai方法 :通过紧凑分箱方法对磁共振成像数据进行预排序,实现了聚集。
- Winkel方法
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



