OpenMP中几个容易混淆的函数（线程数量/线程ID/线程最大数）以及并行区域线程数量的确定

最新推荐文章于 2025-05-06 08:32:31 发布

转载最新推荐文章于 2025-05-06 08:32:31 发布 · 1.2k 阅读

OpenMP 专栏收录该内容

23 篇文章

订阅专栏

本文深入解析了OpenMP中几个容易混淆的函数，包括线程数量的确定机制及几个核心函数（如omp_get_thread_num、omp_get_num_threads、omp_set_num_threads和omp_get_max_threads）的详细解释与使用场景。通过实例分析，清晰地展示了这些函数之间的区别和相互作用，帮助开发者更好地理解和应用OpenMP进行并行编程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

说明：这部分内容比较基础，主要是分析几个容易混淆的OpenMP函数，加以理解。

（1）并行区域数量的确定：

在这里，先回顾一下OpenMP的parallel并行区域线程数量的确定，对于一个并行区域，有一个team的线程去执行，那么该分配多少个线程去执行呢？

OpenMP的遇到parallel指令后创建的线程team的数量由如下过程决定：

1. if子句的结果

2. num_threads的设置

3. omp_set_num_threads()库函数的设置

4. OMP_NUM_THREADS环境变量的设置

5. 编译器默认实现（一般而言，默认实现的是总线程数等于处理器的核心数）

（ http://blog.youkuaiyun.com/gengshenghong/article/details/6956878 查看更多信息）

2、3、4优先级依次降低的，也就是前面的设置可以覆盖后面的设置，当然也是相对而言，num_threads子句只会影响当前的并行区域，而omp_set_num_threads对OMP_NUM_THREADS环境变量的覆盖是在整个程序运行期间全局的。

（2）几个容易混淆的OpenMP函数

1. omp_get_thread_num

获取线程的num，即ID。这里的ID是OpenMP的team内的ID，在OpenMP中，一个team内的线程的ID是俺顺序排列的，0、1、2...

说明：此函数在并行区域外或者并行区域内都可以调用。在并行区域外，获取的是master线程的ID，即为0。在并行区域内，每次执行到此函数，获取的是当前执行线程的ID。

此函数比较容易理解，主要是不要和下面的omp_get_num_threads记混淆了。

2. omp_get_num_threads/omp_set_num_threads

设置/获取线程数量，此set函数是上面确定遇到parallel指令后创建team的线程的决定方式之一，用于覆盖OMP_NUM_THREADS环境变量的设置。

说明：尽管从函数名上看，它们是一对set/get函数，但是要区分它们的含义，set之后马上get，其值不一定等于set的结果，而且大部分情况都是不相等的！

首先来理解omp_set_num_threads()：

作用上来说，我们知道它是用于覆盖环境变量OMP_NUM_THREDS的设置的，使用上来说，要注意的是，omp_set_num_threads只能用于并行区域之外，如果用于并行区域之内，在Debug下运行时会输出“User Error 1001: omp_set_num_threads should only be called in serial regions”到控制台，如果是Release模式不会输出，理论上应该是被忽略了。总之，在串行代码区调用omp_set_num_threads来设置线程数量。

然后分析omp_get_num_threads()：

用于获取当前线程组（team）的线程数量，如果不在并行区调用，返回1.

这句话就清楚了描述了get的作用了，获取的是当前线程组的线程数量，所以一般会在并行区域调用，其返回的是实际的parallel区域内由上面几大因素决定之后的实际的运行的线程数量，并不是set的值，所以也很容易理解，在串行区调用它会返回1（所以一般也不会在串行区去调用）。

总结：omp_set_num_threads在串行区域调用才会有效，omp_get_num_threads获取当前线程组的线程数量，一般在并行区域调用，在串行区域调用返回为1。两个函数没有本质上的数量关系！

3. omp_get_max_threads：

从函数名看，貌似是“获取最大的线程数量”，是的，那么这个“最大的线程数量"的具体含义呢？下面是OpenMP文档上的一段话：

The omp_get_max_threads routine returns an upper bound on the number of threads that could be used to form a new team if a parallel region without a num_threads clause were encountered after execution returns from this routine。

很清楚的说明了，这个”最大数量“是指在不使用num_threads的情况下，OpenMP形成一个新的team能创建的最大线程数量。从这里要理解到：这个最大数量，是能确定的，与其在并行区域调用，还是在串行区域调用是无关的，因为它是返回OpenMP当前环境下去创建一个”新的“team能创建的可能的最大数量。简单的理解，其实，这个值就是由以下三者确定：omp_set_num_threads、OMP_NUM_THREADS、编译器默认实现。

注意：omp_get_max_threads可以在串行或并行区域内调用，而且其结果是一样的（在其间不调用omp_set_num_threads的情况下），如果有效调用（串行区调用）了omp_set_num_threads，会改变接下来调用omp_get_max_threads的值。另外，omp_get_max_threads的返回值可能会小于omp_set_num_threads。

4. 实例：

下面的例子是使用上面几个函数的例子，根据结果可以分析出上面提到的一些内容：

[cpp]view plaincopy 
     
 #include <omp.h>  
   
 int main(int argc, _TCHAR* argv[])    
 {  
     printf("ID: %d, Max threads: %d, Num threads: %d \n",omp_get_thread_num(), omp_get_max_threads(), omp_get_num_threads());  
     omp_set_num_threads(5);  
     printf("ID: %d, Max threads: %d, Num threads: %d \n",omp_get_thread_num(), omp_get_max_threads(), omp_get_num_threads());  
   
 #pragma omp parallel num_threads(5)  
     {  
         // omp_set_num_threads(6);  // Do not call it in parallel region  
         printf("ID: %d, Max threads: %d, Num threads: %d \n",omp_get_thread_num(), omp_get_max_threads(), omp_get_num_threads());  
     }  
   
     printf("ID: %d, Max threads: %d, Num threads: %d \n",omp_get_thread_num(), omp_get_max_threads(), omp_get_num_threads());  
       
     omp_set_num_threads(6);  
     printf("ID: %d, Max threads: %d, Num threads: %d \n",omp_get_thread_num(), omp_get_max_threads(), omp_get_num_threads());  
   
     return 0;    
 }