计算机生成全息图计算的加速方法与实践
1. CPU 端全息图计算加速
1.1 SIMD 指令与 OpenMP 的应用
在全息图计算中,我们尝试使用 SIMD 指令来加速计算。通过计算全息图平面 x 轴方向的递推公式,可以得到一行的 CGH 像素。由于可以同时计算多行,因此可以使用 SIMD 指令。例如,对于 AVX 可以使用 256 位打包数据,在 32 位计算精度下,一次能计算全息图平面的八行。不过,OpenMP 虽然能在丢失索引的情况下生成并行程序,但似乎无法为 SIMD 指令生成打包数据。我们准备了示例程序 “appendix/6-recurrence_float_lut_line/xyz_to_psi.c” 来帮助编译器使用打包数据生成 SIMD 指令,但性能提升有限。为了进一步生成 SIMD 指令,我们采用了 Intel Intrinsics。
1.2 整数类型的小数计算
为了加速计算,我们将数据格式从浮点型改为整型,即从浮点运算转变为定点运算。定点运算有诸多优势,比如可以直接处理二进制数,简化算术电路,缩短指令的吞吐量和延迟。而且利用二进制数的特性,右移一位比除以二计算更快。
不过,简单地更改变量类型并不能正确计算。整数类型是简单的二进制数,而浮点格式使用尾数和指数表示值。浮点型在相同字长下能表示更广泛的数值范围,但由于部分位分配给了指数,有效数字位数会减少。使用整型变量表示小数值时,必须调整小数点位置以确保必要的有效数字,这会增加数值转换的开销,使源代码更难阅读。
以下是使用整型的 xyz_to_psi 函数示例:
超级会员免费看
订阅专栏 解锁全文
75

被折叠的 条评论
为什么被折叠?



