apex centos下安装踩坑
apex
1.0 pytorch版本、cuda版本的对应问题
安装apex需要机器上的pytorch版本和cuda是对应的版本,否则报错。
cuda版本查看 cat /usr/local/cuda/version.txt
https://pytorch.org/get-started/previous-versions/
2.0 gcc版本问题
centos默认gcc4.8.5,不满足apex需要的gcc版本大于5.0。可以使用yum安装并指定gcc版本
笔者参考 https://www.cnblogs.com/jixiaohua/p/11732225.html
若scl enable devtoolset-8 bash 命令失败,gcc 版本没变,那么直接去/opt/rh/devtoolset-8 下面enable 即可
2.1 yum更新gcc过程中遇到nvidia-docker的GPG验证问题
yum install centos-release-scl
命令报错:
repomd.xml signature could not be verified for nvidia-docker
参考
https://blog.youkuaiyun.com/u012560213/article/details/101430549
关闭GPG key的验证机制解决
3.0 apex安装后,发现EncdecMultiheadAttn module找不到的问题
quickstart上的安装命令不得行,需要uninstall,然后具体指定,使用连接上的命令
https://github.com/NVIDIA/a