一.环境
基本环境:RTX3060+ubuntu20.04+cuda11.1
其他:gcc -7, g++ -7, Ananconda虚拟环境+python3.6
二.安装
版本对应非常严格,亲测按照网上别人普遍的以下顺序安装方法:
pip install nvidia-pyindex
pip install nvidia-tensorflow[horovod]
...
会出现胡乱安装依赖导致安装不成功的问题。
正确姿势:
2.1 优先安装依赖:
nvidia-cublas 11.2.1.74
nvidia-cuda-cupti 11.1.69
nvidia-cuda-nvcc 11.1.74
nvidia-cuda-nvrtc 11.1.74
nvidia-cuda-runtime 11.1.74
nvidia-cudnn 8.0.4.30
nvidia-cufft 10.3.0.74
nvidia-curand 10.2.2.74
nvidia-cusolver 11.0.0.74
nvidia-cusparse 11.2.0.275
nvidia-dali-cuda110 0.26.0
nvidia-dali-nvtf-plugin 0.26.0+nv20.10
nvidia-nccl 2.7.8
nvidia-pyindex 1.0.5
nvidia-tensorboard 1.15.0+nv20.10
nvidia-tensorrt 7.2.1.4
tensorflow-estimator 1.15.1
版本一定要一样,注意是在python3.6环境下,以上包也有安装顺序,本人也是在anaconda下删除又下载了三遍环境才安装上。
最好使用pip3 install X==x.x.x -i http://pypi.douban.com/simple --trusted-host pypi.douban.com --no-deps
一个一个安装,–no-deps就是不安装依赖。本人参考了这篇博客:https://blog.youkuaiyun.com/qq_35635340/article/details/110138215,博主提供了所有依赖包括tensorflowgpu1.15的.whl文件百度网盘地址
,直接下载下来pip就行。
也可以安装上图依赖之后:
pip install nvidia-tensorflow==1.15.4+nv20.10 -i http://pypi.douban.com/simple --trusted-host pypi.douban.com --no-deps
2.2 安装其他依赖
安装后命令行还会显示一堆未安装的包或者某个包需要大于某个版本的包比如需要numpy大于什么版本,protobuf需要等于什么版本再直接按照规定pip安装下来就行,本人安装成功的所有包列表:
absl-py 0.7.0
astor 0.6
cached-property 1.5.2
certifi 2020.6.20
dataclasses 0.8
gast 0.2.2
google-pasta 0.1.6
grpcio 1.8.6
h5py 3.1.0
importlib-resources 5.4.0
Keras-Applications 1.0.8
Keras-Preprocessing 1.0.5
Markdown 2.6.8
numpy 1.18.0
nvidia-cublas 11.2.1.74
nvidia-cuda-cupti 11.1.69
nvidia-cuda-nvcc 11.1.74
nvidia-cuda-nvrtc 11.1.74
nvidia-cuda-runtime 11.1.74
nvidia-cudnn 8.0.4.30
nvidia-cufft 10.3.0.74
nvidia-curand 10.2.2.74
nvidia-cusolver 11.0.0.74
nvidia-cusparse 11.2.0.275
nvidia-dali-cuda110 0.26.0
nvidia-dali-nvtf-plugin 0.26.0+nv20.10
nvidia-nccl 2.7.8
nvidia-pyindex 1.0.5
nvidia-tensorboard 1.15.0+nv20.10
nvidia-tensorflow 1.15.4+nv20.10
nvidia-tensorrt 7.2.1.4
opt-einsum 2.3.2
pip 21.3.1
protobuf 3.6.1
PyYAML 6.0
setuptools 41.0.0
six 1.10.0
tensorflow-estimator 1.15.1
termcolor 1.1.0
torch 1.10.2
tqdm 4.64.1
typing_extensions 4.1.1
webencodings 0.5.1
wheel 0.37.1
wrapt 1.11.1
zipp 3.6.0
2.3 测试
在命令行输入:
python
import tensorflow as tf
tf.__version__
显示:
"1.15.4"
输入:
tf.test.is_gpu_available()
显示True