- 依照官网教程安装docker
- https://docs.docker.com/install/linux/docker-ce/centos/#install-from-a-package 手动安装
- 过程中显示缺依赖包也是手动下载,然后安装
- docker pull
- 因为使用的是内网,就先注册,并且没有测试的hello world可以使用
- 拉的就是简单的tensorflow镜像
- docker run
- 利用docker run启容器并进入后,发现import tensorflow报错:
- 报错:ImportError: libcuda.so.1: cannot open shared object file: No such file or directory
- 解决方法:因为缺少nvidia_docker,需要在创建容器的过程中将相对应的文件夹mount上去
- 本机 /var/lib/nvidia-docker/volumes/nvidia_driver/384/lib/
- echo $LD_LIBRARY_PATH : /usr/local/nvidia/lib:/usr/local/nvidia/lib64
- 将 /var/lib/nvidia-docker/volumes/nvidia_driver/384/lib/ 先挂载到一个路径下,利用2命令,找到路径后复制过去
- docker run --network=host -it -v /var/lib/nvidia-docker/volumes/nvidia_driver/384/lib/:/export/nvidia -v /export/xxx/:/export/xxx/ e138587669af /bin/bash
- docker run --network=host -it -v /var/lib/nvidia-docker/volumes/nvidia_driver/384:/usr/local/nvidia xxx/dl/9.0-cudnn7-devel-ubuntu16.04-py36-tensorflow_17-gpu:1.0.0
- 挂载多个文件就多个-v
- 手动安装opencv
- https://pypi.org/project/opencv-python/#files 下载相应的压缩包
- 上传到服务器之后,pip install
- 注意版本之间的匹配,第一次下载了py3.5的安装报,就报了错:
- opencv_python-4.0.0.21-cp35-cp35m-manylinux1_x86_64.whl is not a supported wheel on this platform
- python ,import cv2 报错:ImportError: libSM.so.6: cannot open shared object file: No such file or directory
- 从https://pkgs.org/download/libsm中搜索下载安装包 *.deb
- 安装 dpkg -i libxext-dev_1.3.3-1_amd64.deb
- 这个过程可能很繁琐,有些包需要依赖其他的包,如果没有安装其他依赖包,就需要继续下载相对用的安装包,比较考验耐心。
- sudo apt-get install --reinstall -d `apt-cache depends libfontconfig1 | grep 依赖 | cut -d : -f 2`
- 下载libfontconfig1的全部依赖包
- 利用docker run启容器并进入后,发现import tensorflow报错: