AVX - 512在浮点矩阵运算中的应用解析
1. CalcDistances_avx512函数
CalcDistances_avx512函数的NASM实现中的SIMD三元代码采用了与MASM实现相同的AVX - 512指令序列。该函数的尾声部分包含一条 add rsp,16 指令,其作用是释放之前分配的本地栈存储空间,并为后续的 pop 和 ret 指令正确定位RSP。以下是源代码示例Ch14_03的结果:
----- Results for Ch14_03 (thresh = 25.0000) -----
x1 y1 x2 y2 | d1 d2
------------------------------------------------------------
1.4193 60.9381 28.1498 62.3203 | -26.7662 -26.7662
45.6211 31.3445 17.8668 52.2026 | -34.7183 -34.7183
19.3088 69.7241 40.1756 18.2590 | -55.5345 -55.5345
35.7644 74.3092 25.8307 19.3251 | -55.8742 -55.8742
26.5019 28.6746 27.3385 51.6712 | 23.0119 23.011
超级会员免费看
订阅专栏 解锁全文
84

被折叠的 条评论
为什么被折叠?



