Linux下Linpack测试GPU和CPU性能

本文详细介绍了如何配置Linpack环境并编写运行脚本,包括设置关键环境变量如MKL_NUM_THREADS、OMP_NUM_THREADS等,以及HPL.dat参数的调整方法。适用于高性能计算领域的研究人员和技术人员。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前面的文章已经介绍了如何搭建Linpack环境:https://blog.youkuaiyun.com/liu_feng_zi_/article/details/107429720 

接下来说明如何使用

一、编写运行脚本:

新建文件:run_linpack.sh,内容如下:

export HPL_DIR =/root/LHC/Linpack/hpl-2.0_FERMI_v15
export MKL_NUM_THREADS=6
export OMP_NUM_THREADS=6
export MKL_DYNAMIC=FALSE
export CUDA_DGEMM_SPLIT=0.836
export CUDA_DTRSM_SPLIT=0.806
export LD_LIBRARY_PATH= $HPL_DIR/src/cuda:$LD_LIBRARY_PATH
$HPL_DIR/bin/CUDA/xhpl

1、MKL_NUM_THREADS:每个进程使用的CPU核的数量

2、OMP_NUM_THREADS:每个GPU使用的CPU核的数量

例如:2个GPU和8个CPU,则OMP_NUM_THREADS=4

3、CUDA_DGEMM_SPLIT:发送给GPU的DGEMM占总的百分比,大致等于(GPU GFLOPS)/(GPU GFLOPS + CPU GFLOPS),或者( 350 ) / ( 350 + 每个GPU的CPU数量 * 4 * CPU基本频率 )

4、CUDA_DTRSM_SPLIT:发送给GPU的DTRSM占总的百分比,通常比DGEMM低0.05-0.10

5、HPL_DIR:文件的路径

二、HPL.dat参数设置:

之前的文章写过:https://blog.youkuaiyun.com/liu_feng_zi_/article/details/107416291

三、执行文件:

单节点执行:

./run_linpack.sh

多节点执行(没有测试过,仅供参考):

mpirun -np N ./run_linpack.sh
#N为节点数

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值