AVX2编程:扩展指令详解
1. FMA与非FMA指令的数值差异
在使用FMA(融合乘加)指令的函数和使用独立乘法与加法指令的等效函数之间,小的数值差异并不罕见。通过比较 Convolve2Ks5_ 和 Convolve2Ks5Test_ 函数的输出结果可以证实这一点。以下是一些数值差异的示例:
| Index | x[] | Convolve2Ks5_ | Convolve2Ks5Test_ |
|---|---|---|---|
| 33 | 1.3856432 | 1.1940877 | 1.1940879 |
| 108 | 1.3655651 | 1.4466031 | 1.4466029 |
| 180 | -2.8778596 | -2.7348523 | -2.7348526 |
| 277 | -1.7654022 | -2.0587211 | -2.0587208 |
超级会员免费看
订阅专栏 解锁全文
104

被折叠的 条评论
为什么被折叠?



