cpu代码加速: 多线程:openmp并行\nOpenMP支持的编程语言包括C语言、C++和Fortran;而支持OpenMp的编译器包括Sun Compiler,GNU Compiler和Intel Compiler等。OpenMp提供了对并行算法的高层的抽象描述。\n\n程序员通过在源代码中加入专用的#pragma来指明自己的意图,由此编译器可以自动将程序进行并行化,并在必要之处加入同步互斥以及通信。\n当选择忽略这些#pragma,或者编译器不支持OpenMP时,程序又可退化为通常的程序(一般为串行),代码仍然可以正常运作,只是不能利用多线程来加速程序执行。\n\n矩阵相乘通过 openmp 实现多线程并行加速示例:\n\n static void matMultCPU_parallel(const float* a, const float* b, float* c, int n)\n {\n #pragma omp parallel for schedule(dynamic)\n for (int i = 0; i \u003C n; i++)\n {\n for (int j = 0; j \u003C n; j++)\n {\n double t = 0;\n for (int k = 0; k \u003C n; k++)\n {\n t += (double)a[i * n + k] * b[k * n + j];\n }\n c[i * n + j] = t;\n }\n }\n }