Ascend_PyTorch安装指北
主要分为以下几步:
- 升级固件和驱动;
- 安装CANN包toolkit;
- 安装torch-1.11;
- 安装apex;
- 安装deepspeed;
升级固件和驱动
固件版本为:Ascend-hdk-910-npu-firmware_6.3.0.1.241.run
驱动版本为:Ascend-hdk-910-npu-driver_23.0.rc1_linux-aarch64.run
关于固件驱动,昇腾提供社区版下载链接
这里有几个选项注意下:
- 产品系列:服务器
- 产品型号:Atlas 800训练服务器(型号:9000)(对于x86的CPU,型号选9010)
- CANN版本:6.3.RC2.alpha002
- 固件与驱动:1.0.19.alpha
- 软件包格式:run
下载后,切换到管理员账户运行:
bash Ascend-hdk-910-npu-firmware_6.3.0.1.241.run --full
# 上面一步安装完后,暂时不要reboot,等下面的驱动一起安装完后,再reboot
bash Ascend-hdk-910-npu-driver_23.0.rc1_linux-aarch64.run --full --install-for-all
# 重启机器使固件和驱动生效
reboot now
重启后,测试安装的固件驱动是否有效:
npu-smi info
第一行显示 npu-smi 23.0.rc1 Version: 23.0.rc1
则表示升级成功!
安装CANN包toolkit
昇腾提供CANN包的社区版下载链接
在这里选取最新的6.3.RC2.alpha002版本,跟