13、基于点云的CGH计算在CPU上的加速策略

最新推荐文章于 2025-08-31 10:54:57 发布

会议雕塑

最新推荐文章于 2025-08-31 10:54:57 发布

阅读量50

点赞数

CC 4.0 BY-SA版权

分类专栏：计算全息的硬件革命文章标签：点云 CGH计算 CPU加速

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/pandas7gardener/article/details/151056356

计算全息的硬件革命专栏收录该内容

29 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

基于点云的CGH计算在CPU上的加速策略

1. 并行计算与内存需求

在进行相关计算时，如果有可用的点，我们可以进行并行计算。为此，我们准备了与目标点数相同数量的伽马射线。计算所需的内存需要更多的缓冲区来存储伽马（gamma）、德尔塔（delta）和西塔（theta）。测试机器有8个逻辑CPU，各缓冲区大小如下：
- 伽马缓冲区大小：线程数 × 浮点数大小 × 目标点数 = 32Nobj
- 德尔塔缓冲区大小：线程数 × 浮点数大小 × 目标点数 = 32Nobj
- 西塔缓冲区大小：线程数 × 浮点数大小 × 目标点数 = 32Nobj

使用的内存量会增加96Nobj字节，所需内存量高度依赖于目标点数。这对于高分辨率对象来说是一个主要问题，在这种情况下，无论计算速度如何，计算都可能无法进行。

采用适合CPU的算法后，计算速度几乎提高了一倍，具体性能如下表所示：
| Nobj | 计算时间 [s] | 加速率 | 使用内存 [MiB] (12Nobj + 4Nhol + 96Nobj) |
| ---- | ---- | ---- | ---- |
| 710 | 0.21 | 136.96 (1.85) | 7.98 (0.01 + 7.91 + 0.07) |
| 44,647 | 11.20 | 163.28 (1.97) | 12.51 (0.51 + 7.91 + 4.09) |
| 978,416 | 1,908.04 | 21.39 (0.99) | 108.68 (11.20 + 7.91 + 89.58) |

2. 使用查找表减少延迟

与最初

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。