6678_OpenMP学习笔记整理（一）——环境变量+嵌套并行

最新推荐文章于 2025-05-26 12:32:02 发布

huang_wifi

最新推荐文章于 2025-05-26 12:32:02 发布

阅读量1.8k

点赞数 1

CC 4.0 BY-SA版权

文章标签：多线程 openmp

本文链接：https://blog.youkuaiyun.com/huang_wifi/article/details/116044855

OpenMP API 用户指南
一、环境变量
1、OMP_SCHEDULE
有效类型：static、dynamic、guided、auto、sunw_mp_sched_reserved
若使用时设置为非有效类型，按默认static处理，不指定块大小，并发出warn

2、OMP_NUM_THTEADS
若指定值不是正整数，则忽略此变量，并发出warn
若工程中未设置此变量，则默认为处理器核心数，并≤32

3、OMP_DYNAMIC
类似于bool类型，值为true或false，缺省时默认为true，非法值时默认为ture，并发出warn

4、OMP_PROC_BIND（这部分我要再想想）
如果为 OMP_PROC_BIND 指定的值不是 TRUE、FALSE 或者逗号分隔的 master、close 或 spread 列表，则以非零状态退出进程。
如果无法将初始线程绑定到 OpenMP 位置列表中的第一个位置，则以非零状态退出进程。
如果未设置，则使用缺省值 FALSE。

5、OMP_PLACES
若设置的值无效，则以非零状态退出进程
若未设置，则使用缺省值 cores

6、OMP_NESTED
7、OMP_STACKSIZE
8、OMP_WAIT_POLICY
9、OMP_MAX_ACTIVE_LEVELS
10、OMP_THREAD_LIMIT
11、OMP_DISPLAY_ENV

二、Oracle Solaris Studio 环境变量（以下环境变量指定的值为不区分大小写）
1、PARALLEL
如果同时设置 PARALLEL 和 OMP_NUM_THREADS，则必须将它们设置为相同的值

2、SUNW_MP_WARN
常见错误：区域嵌套错误、显式屏障位置错误、死锁、环境变量的设置无效等等

3、 SUNW_MP_THR_IDLE
控制 OpenMP 程序中正在等待工作（空闲）或者正在屏障处等待的线程的行为
可设置为：SPIN、SLEEP、SLEEP(time s)、SLEEP(time ms)、SLEEP(time mc)
其中time设为整数，mc为us，若未设置时间单位，则默认为s

4、SUNW_MP_PROCBIND

5、SUNW_MP_MAX_POOL_THREADS
指定 OpenMP 辅助线程池的最大大小
OpenMP 辅助线程是 OpenMP 运行时库创建的用于在并行区域上运行的那些线程
辅助线程池不包含主线程和由用户程序显式创建的任何线程
如果将此环境变量设置为零，则 OpenMP 辅助线程池将为0，并且将由主线程执行所有并行区域，缺省值为1023

6、SUNW_MP_MAX_NESTED_LEVELS
设置嵌套活动并行区域的最大数量，缺省值为4

7、STACKSIZE
设置每个 OpenMP 辅助线程的堆栈大小
可选后缀 B、K、M 或 G（分别表示字节、千字节、兆字节或千兆字节）的数值，缺省时默认为K
如果未设置，则对于 32 位应用程序，缺省 OpenMP 辅助线程堆栈大小为 4 MB；对于 64 位应用程序，缺省值为 8 MB

8、SUNW_MP_GUIDED_WEIGHT
设置加权因子，该因子用于确定使用 guided 调度的循环中的块大小
该值应为正浮点数，并且应用于程序中所有使用 guided 调度的循环
如果未设置，则缺省加权因子为 2.0

9、SUNW_MP_WAIT_POLICY
允许更精确地控制程序中等待工作（空闲）、在屏障处等待或等待任务完成的 OpenMP 线程的行为
在这些等待类型中，每一类型的行为都有三种可能：旋转片刻、让出处理器片刻或休眠直至被唤醒

三、嵌套并行操作
1、OMP_NESTED
可通过设置 OMP_NESTED 环境变量来启用或禁用嵌套并行操作。缺省情况下，禁用嵌套并行操作
以下代码进行三级嵌套：

#include <omp.h>
#include <stdio.h>
void report_num_threads(int level)
{
   
   
    #pragma omp single
    {
   
   
        printf("Level %d: number of threads in the team = %d\n",
                  level, omp_get_num_threads());
    }
 }
int main()
{
   
   
    omp_set_dynamic(0);
    #pragma omp parallel num_threads(2)
    {
   
   
        report_num_threads(1);
        #pragma omp parallel num_threads(2)
        {
   
   
            report_num_threads(2);
            #pragma omp parallel num_threads(2)
            {