我编译一个简单的测试程序用于测试gcc自动向量化使用的是何种指令集。
测试程序如下
for(long long i = 0;i < N;++i){
//测试程序应尽可能的增加浮点运算的次数,减少访存的次数。这样会使向量化之后比较结果更加明显。测试代码的代码平衡值Bc=3/8
C[i]=A[i]*B[
本文介绍了如何通过GCC编译器进行自动向量化优化,并展示了如何利用编译参数调整优化级别和指定CPU架构。通过示例程序和编译选项,揭示了编译器默认使用SSE指令集以及如何切换到AVX指令集进行256位向量运算。同时讨论了编译器在某些情况下无法自动使用AVX512指令集的问题。
我编译一个简单的测试程序用于测试gcc自动向量化使用的是何种指令集。
测试程序如下
for(long long i = 0;i < N;++i){
//测试程序应尽可能的增加浮点运算的次数,减少访存的次数。这样会使向量化之后比较结果更加明显。测试代码的代码平衡值Bc=3/8
C[i]=A[i]*B[
863

被折叠的 条评论
为什么被折叠?