Jacobi的GPU并行迭代 OpenACC

目录

1. 搭建OpenACC运行环境

1.1 安装CUDA11.1

1.2 配置CUDA环境

1.3 安装OpenACC 21.3

1.4 配置openACC环境

2. 程序执行

2.1 GPU上并行,用kernels构件加速二重循环

2.2 Data构件优化Jacobi迭代数据传输

3. 总结

参考文献


利用Jacobi迭代对二维泊松方程进行求解。采用OpenACC并行编程的方式加速迭代过程。

主要思想:用二阶中心差分来近似二阶偏导数,将差分近似代入泊松方程,得到五点差分离散格式,则将泊松方程的求解转换为稀疏线性方程组的求解。然后就可以利用经典的Jacobi算法来求解此方程组。从任意一个初始近似解开始出发,进行迭代计算,直至最终的近似解满足误差要求。

1. 搭建OpenACC运行环境

1.1 安装CUDA11.1

1.2 配置CUDA环境

配置.bashrc文件,添加环境变量,在.bashrc文件的最后添加如下路径。

        配置路径如下:(注意,确保cuda的安装地址正确)

export PATH=/usr/local/cuda/bin:$PATH

export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

1.3 安装OpenACC 21.3

    此处需要注意最好是安装的OpenACC应支持前一个版本的CUDA即,Bundled with the newest plus two previous CUDA versions

安装命令如下

$ wget https://developer.download.nvidia.com/hpc-sdk/21.3/nvhpc-21-3_21.3_amd64.deb \

  https://developer.download.nvidia.com/hpc-sdk/21.3/nvhpc-2021_21.3_amd64.deb \

  https://developer.download.nvidia.com/hpc-sdk/21.3/nvhpc-21-3-cuda-multi_21.3_amd64.deb

$ apt-get install ./nvhpc-21-3_21.3_amd64.deb ./nvhpc-2021_21.3_amd64.deb ./nvhpc-21-3-cuda-multi_21.3_amd64.deb

1.4 配置openACC环境

同样是在.bashrc文件中,在文件最后添加路径,配置如下(注意,此处的OpenACC安装路径是自己实际的安装路径):

export PATH=/opt/nvidia/hpc_sdk/Linux_x86_64/2021/compilers/bin:$PATH

export PGI_ACC_TIME=1

export PGI_ACC_NOTIFY=1
执行pgcc --version,出现openacc版本内容,则说明安装成功,环境配置成功。

2. 程序执行

2.1 GPU上并行,用kernels构件加速二重循环

// Jacobi_GPU_noerror.c
#include<stdio.h>
#include<stdlib.h>
#include<math.h>
#include<sys/time.h>
#define  gettime(a)  gettimeofday(a,NULL)
#define  usec(t1,t2)  (((t2).tv_sec-(t1).tv_sec)*1000000 \
		 +((t2).tv_usec-(t1).tv_usec))
typedef struct timeval  timestruct;

#define Mx  8191     //定义网格尺寸Mx和Ny,此处为了数组的内存对齐,所以设为8192-1
#define Ny  1023     //1024-1
float  uval(float x, float y){return (x*x+y*y);}
int main()
{
	floa
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值