AVX2与AVX - 512编程:浮点与整数运算优化
1. 一维离散卷积函数性能分析
一维离散卷积在信号处理等领域有着广泛的应用。这里对单精度和双精度的一维离散卷积函数进行了性能测试,使用了不同的处理器(i5 - 11600K、i7 - 11700K、7700X)。
1.1 单精度卷积函数性能
| 函数名 | i5 - 11600K | i7 - 11700K | 7700X |
|---|---|---|---|
| Convolve1D_Ks5_F32_cpp() | 742 (4) | 3618 (75) | 272 (2) |
| Convolve1D_Ks5_F32_avx2() | 657 (4) | 623 (29) | 268 (2) |
从表格数据可以看出,使用AVX2指令集的 Convolve1D_Ks5_F32_avx2() 函数在大部分处理器上的性能优于普通的C++实现 Convolve1D_Ks5_F32_cpp() 。
1.2 双精度卷积函数性能
| 函数名 < |
|---|
AVX-512整数与浮点优化详解
超级会员免费看
订阅专栏 解锁全文
92

被折叠的 条评论
为什么被折叠?



