X86 - 64 SIMD编程:向量、椭球、图像与矩阵计算
1. 向量叉积计算与性能测试
在向量计算中,进行了多次向量叉积的计算。例如:
- 向量叉积6:
- a1/a2: [78.0, 58.0, 43.0]
- b1/b2: [47.0, 48.0, 42.0]
- c1: [372.0, -1255.0, 1018.0]
- c2: [372.0, -1255.0, 1018.0]
- 向量叉积7:
- a1/a2: [23.0, 64.0, 86.0]
- b1/b2: [10.0, 42.0, 71.0]
- c1: [932.0, -773.0, 326.0]
- c2: [932.0, -773.0, 326.0]
同时,对不同CPU上的向量叉积函数执行时间进行了测试,测试结果如下表所示:
| CPU | Sse64VectorCrossProd1_ (SOA) | Sse64VectorCrossProd2_ (AOS) |
| — | — | — |
| Intel Core i7 - 4770 | 67 | 50 |
| Intel Core i7 - 4600U | 106 | 74 |
| Intel Core i3 - 2310M | 165 | 126 |
从表格中可以看出,不同CPU的性能表现存在差异,且不同的向量叉积函数实现方式(SOA和AOS)在同一CPU上的执行时间也有所不同。
2. 椭球计算
椭球是一种三维立体图形,其平面横截面为椭圆。椭球的大小由其三
超级会员免费看
订阅专栏 解锁全文
1063

被折叠的 条评论
为什么被折叠?



