ubuntu 安装 nccl(最全)

1、多GPUs进行并行计算,Caffe自带实现. 在多个 GPU 上运行 Caffe 需要使用 NVIDIA NCCL。

刚开始装的时候,我也踩了许多坑,直到在谷歌上找到NVIDIA的官方文档,才有效的解决了安装的问题。

官方nccl的安装说明:https://docs.nvidia.com/deeplearning/sdk/nccl-install-guide/index.html

https://docs.nvidia.com/deeplearning/sdk/nccl-install-guide/index.html

我主要是参考安装文档中的下面三句命令:

因为在官网上我下的是网络存储库版本,(ps:但是我一直以为是本地存储库,请大家一定要看清自己下的安装包的名称,对号入座

之后,在我的服务器上输入:


sudo dpkg -i nvidia-machine-learning-repo-ubuntu1604_1.0.0-1_amd64.deb


sudo apt update


sudo apt install libnccl2=2.2.13-1+cuda9.0 libnccl-dev=2.2.13-1+cuda9.0

没有报错,安装成功。

更多精彩请关注公众号【AI算法与数学之美】

或者扫下方图片二维码奥

别忘记关注公众号与点  “在看

 

### 如何在 Linux 上安装配置 NCCL #### 添加存储库 为了便于更新和管理,在 Ubuntu安装 NCCL 需要先将包含 NCCL 包的 APT 存储库添加到系统中。推荐使用网络存储库来简化未来版本的升级过程[^2]。 对于大多数用户而言,这一步骤涉及编辑 `/etc/apt/sources.list` 文件或创建一个新的 `.list` 文件于 `/etc/apt/sources.list.d/` 目录内,并加入如下行: ```bash deb http://developer.download.nvidia.com/compute/machine-learning/repos/<distro>/<architecture> / ``` 其中 `<architecture>` 应替换为实际使用的架构名称(如 `x86_64`, `ppc64le`),而 `<distro>` 则应对应具体的发行版代号(如 `ubuntu1604`, `ubuntu1804`, 或 `ubuntu2004`)。完成上述操作后需执行命令刷新软件源列表: ```bash sudo apt-get update ``` #### 安装 NCCL 软件包 一旦成功添加了合适的存储库之后,就可以利用 APT 工具来进行 NCCL安装工作。通常情况下只需要一条简单的指令即可实现目标: ```bash sudo apt install libnccl2 libnccl-dev ``` 这条命令会自动处理依赖关系并下载所需的文件至本地机器上[^1]。 #### 环境变量设置 如果是在非 root 用户环境中部署,则可能还需要手动调整一些环境变量以确保程序能够正常找到已安装NCCL 库。可以通过修改用户的 shell profile 文件(比如 `.bashrc` 或者 `.zshrc`)来达到这一目的。常见的做法是追加以下几行代码: ```bash export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/lib export PATH=/usr/local/bin:$PATH source ~/.bashrc # 假设当前shell为bash ``` 以上路径假设 NCCL 默认被安置到了标准位置;如果不是的话,请依据实际情况作出相应更改。
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值