DEBUG -- 安装nccl-tests时的报错

NCCL 的全称为 Nvidia 聚合通信库(NVIDIA Collective Communications Library),是一个可以实现多个 GPU、多个结点间聚合通信的库,在 PCIe、Nvlink、InfiniBand 上可以实现较高的通信速度。对于每台主机均使用多进程的情况,使用 NCCL 可以获得最大化的性能。

在安装完成后需要测试nccl,就可以使用自带的nccl-tests来测试nccl,但是会出现各种各样的错误。

找不到nccl.h
在编译nccl-tests时,使用

make nccl-tests

但是会出现找不到nccl.h的错误,就需要在~/.basgrc中寫入

export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

找不到libnccl.so.2

export LD_LIBRARY_PATH=~/.local/lib/python3.6/site-packages/torch/nccl/build/lib:$LD_LIBRARY_PATH

LD_LIBRARY_PATH是Linux环境变量名,该环境变量主要用于指定查找共享库(动态链接库)时除了默认路径之外的其他路径。使用

echo $LD_LIBRARY_PATH 

可以查看環境變量

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值