目录
利用Jacobi迭代对二维泊松方程进行求解。采用OpenACC并行编程的方式加速迭代过程。
主要思想:用二阶中心差分来近似二阶偏导数,将差分近似代入泊松方程,得到五点差分离散格式,则将泊松方程的求解转换为稀疏线性方程组的求解。然后就可以利用经典的Jacobi算法来求解此方程组。从任意一个初始近似解开始出发,进行迭代计算,直至最终的近似解满足误差要求。
1. 搭建OpenACC运行环境
1.1 安装CUDA11.1
1.2 配置CUDA环境
配置.bashrc文件,添加环境变量,在.bashrc文件的最后添加如下路径。
配置路径如下:(注意,确保cuda的安装地址正确)
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
1.3 安装OpenACC 21.3
此处需要注意最好是安装的OpenACC应支持前一个版本的CUDA即,Bundled with the newest plus two previous CUDA versions
安装命令如下
$ wget https://developer.download.nvidia.com/hpc-sdk/21.3/nvhpc-21-3_21.3_amd64.deb \
https://developer.download.nvidia.com/hpc-sdk/21.3/nvhpc-2021_21.3_amd64.deb \
https://developer.download.nvidia.com/hpc-sdk/21.3/nvhpc-21-3-cuda-multi_21.3_amd64.deb
$ apt-get install ./nvhpc-21-3_21.3_amd64.deb ./nvhpc-2021_21.3_amd64.deb ./nvhpc-21-3-cuda-multi_21.3_amd64.deb
1.4 配置openACC环境
同样是在.bashrc文件中,在文件最后添加路径,配置如下(注意,此处的OpenACC安装路径是自己实际的安装路径):
export PATH=/opt/nvidia/hpc_sdk/Linux_x86_64/2021/compilers/bin:$PATH
export PGI_ACC_TIME=1
export PGI_ACC_NOTIFY=1
执行pgcc --version,出现openacc版本内容,则说明安装成功,环境配置成功。
2. 程序执行
2.1 GPU上并行,用kernels构件加速二重循环
// Jacobi_GPU_noerror.c
#include<stdio.h>
#include<stdlib.h>
#include<math.h>
#include<sys/time.h>
#define gettime(a) gettimeofday(a,NULL)
#define usec(t1,t2) (((t2).tv_sec-(t1).tv_sec)*1000000 \
+((t2).tv_usec-(t1).tv_usec))
typedef struct timeval timestruct;
#define Mx 8191 //定义网格尺寸Mx和Ny,此处为了数组的内存对齐,所以设为8192-1
#define Ny 1023 //1024-1
float uval(float x, float y){return (x*x+y*y);}
int main()
{
floa

最低0.47元/天 解锁文章
553

被折叠的 条评论
为什么被折叠?



