Framework | Docker & Nvidia-Docker

最新推荐文章于 2025-03-11 17:53:00 发布

明灵暗尘

最新推荐文章于 2025-03-11 17:53:00 发布

阅读量226

点赞数

分类专栏： Framework

本文链接：https://blog.youkuaiyun.com/silence_iz/article/details/104321556

版权

Framework 专栏收录该内容

5 篇文章

订阅专栏

Catalogue

Introduction
- 1.1 tips
Installation
Reference

Introduction

1.1 tips

a container is designed to virtualize a single application, and all containers deployed on a host share a single OS kernel.¹
docker containers are platform-agnostic, but also hardware-agnostic.¹
docker images are built layer-by-layer and the layers can be shared with multiple images to save disk space on the host (as well as deployment time).¹
there are some differences when installing nvidia-docker between version 1.0 and version 2.0, nvidia-docker 1.0 must register runtime, just follow as nvidia-docker github. More detail can be seen in this 优快云 blog.²

Installation

1.1 download

download the docker from link (password: 6i8g)

1.2 install docker-ce and nvidia-docker 2.0

# cd docker foler

sudo dpkg -i libltdl7_2.4.6-2_amd64.deb
sudo dpkg -i docker-ce-cli_19.03.3~3-0~ubuntu-bionic_amd64.deb
sudo dpkg -i containerd.io_1.2.6-3_amd64.deb
sudo dpkg -i docker-ce_19.03.3\~3-0\~ubuntu-bionic_amd64.deb
docker -v

# nvidia-docker 2.0
sudo dpkg -i libnvidia* nvidia*
sudo pkill -SIGHUP dockerd
nvidia-docker -v

1.3 alter to ali source

sudo gedit  /etc/docker/daemon.json

# append
{
    "registry-mirrors":["http://hub-mirror.c.163.com"] 
}

# restart docker
sudo systemctl daemon-reload  
sudo systemctl restart docker

1.4 add user to docker group

sudo gpasswd -a ${USER} docker

sudo systemctl restart docker

newgrp - docker

Reference

Nvidia Docker ↩︎ ↩︎ ↩︎
优快云 blog ↩︎

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

明灵暗尘

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

NVIDIA-Docker

风轻云淡

07-06

1118

1、安装nvidia-docker基础镜像（官网拉取，选定自己版本） docker run --runtime=nvidia --rm nvidia/cuda:9.0-base nvidia-smi docker run --runtime=nvidia --rm nvidia/cuda:10.0-base nvidia-smi docker run --runtime=nvidia --rm nvidia/cuda:10.1-base nvidia-smi docker run --runtime=n

ubuntu18.04中基于Docker搭建tensorflow-gpu开发环境

error的博客

06-07

1241

前提条件就不多提啦，首先得装好nvidia驱动和Docker19以上版本，网上有很多教程。deepo是一个囊括几乎所有深度学习框架的开源镜像，这里我们选择拉取一个tensorflow-gpu版本的，避免占用储存过大。多方查找原因无法解决，决定尝试另一种方法需要注意，选择的cuda版本需要满足宿主机的显卡驱动需求：官网宿主机的驱动版本为，因此选用11.0的即可拉取镜像官方地址这里选择，复制命令：镜像比较大，需要耐心等待，拉取中～拉取完成： 2 通过镜像建立容器通过以下指令：说明：：以交互模型运

参与评论您还未登录，请先登录后发表或查看评论

Ubuntu16.04安装nvidia-docker2

woods的博客

12-13

766

安装docker Ubuntu16.04安装docker 安装nvidia-docker2 参考官方提供的readme # Add the package repositories distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/gpgke...

Docker 容器配置NVIDIA环境

最新发布

ydscc的博客

03-11

1219

这样，你的 Docker 容器就能正确使用 GPU 了！🚀 如果你遇到任何问题，请告诉我！如果输出 GPU 相关信息，说明 NVIDIA GPU 已成功在容器内运行。在 Docker 容器内安装 NVIDIA 以支持 GPU，需要使用。如果成功显示 GPU 信息，说明 NVIDIA 驱动已正确安装。如果你希望给正在运行的容器添加 NVIDIA 相关支持，可以。如果一切正常，你应该能看到你的 GPU 设备。如果你已经有一个 Docker 容器（如。并确保宿主机正确安装了。如果你的宿主机尚未安装。

Ubuntu NVIDIA-Docker安装

月照银海似蛟龙的博客

04-19

4917

Docker 是一个开源的应用容器引擎，让开发者可以打包他们的应用以及依赖包到一个可移植的镜像中，然后发布到任何流行的 Linux或Windows操作系统的机器上，也可以实现虚拟化。NVIDIA 改进了原始的Docker，便于容器使用NVIDIA GPU。由于仿真环境的配置需要安装很多库，对于新手不太友好，因此我们提供了Docker镜像，便于开发者使用。尽管Docker理论上适配多种操作系统，但由于后续算法开发仍建议在本地进行，因此操作系统仍需使用Ubuntu。

Nvidia-Docker

YBAdiam的博客

10-26

252

一、Docker Hup加速可以添加国内的阿里云镜像源等 sudo mkdir -p /etc/docker sudo tee /etc/docker/daemon.json <<-'EOF' { "registry-mirrors": [ "https://1nj0zren.mirror.aliyuncs.com", "https://docker.mirrors.ustc.edu.cn", "http://f1361db2.m.

docker nvidia-docker

gloriazhang2013的博客

01-05

454

服务器有好几个人在用，所以想到搭建一个自己可以用的环境，又不影响其他同事使用。接下来就开始了docker的探索 sudo usermod -G docker -a 'sinoagg' sudo systemctl restart docker docker 挂载本地目录和数据卷容器 docker run -it -v /home/sinoagg/Desktop/real_object_detec...

NVIDIA-Docker安装后下载机器学习模型框架

qq_42650805的博客

10-23

221

镜像的基本操作 NVIDIA Docker 安装 1.1 安装准备 * 安装CUDA * 系统设置-->软件与更新-->下载选择其他-->在弹框中选择中国-->选择mirrors.aliyun.com-->右下角选择服务器 * System Settings-->Software &Updates-->Download from-->Othe...

Docker【部署 07】镜像内安装tensorflow-gpu及调用GPU多个问题处理Could not find cuda drivers+unable to find libcuda

2401_87198849的博客

09-18

1102

在Linux环境下，Docker可以支持将宿主机上的目录挂载到容器里。这意味着，如果宿主机上的目录包含软链接，那么这些软链接也会被挂载到容器中。然而，需要注意的是，这些软链接指向的路径必须在Docker容器中是可访问的。也就是说，如果软链接指向的路径没有被挂载到Docker容器中，那么在容器中访问这个软链接可能会失败。检测CUDA版本是必要的，由于使用的是导出的镜像文件，2和3的方法无法使用，最终使用。尝试解决，在容器启动要执行的py文件内加入以下代码，我将以下代码加入到。

docker,nvidia-docker安装

weixin_33566282的博客

08-27

1111

卸载先前的docker Docker 的旧版本被称为 docker，docker.io 或 docker-engine 。如果已安装，请卸载它们： sudo apt-get remove docker docker-engine docker.io containerd runc 使用 Docker 仓库进行安装设置仓库更新 apt 包索引 sudo apt-get update 安装 apt 依赖包，用于通过HTTPS来获取仓库: sudo apt-get install apt-transpor

nvidia-docker, 利用 NVIDIA gpu构建和运行 Docker 容器.zip

10-10

nvidia-docker, 利用 NVIDIA gpu构建和运行 Docker 容器 NVIDIA gpu的 Docker 引擎实用程序文档完整的文档和常见问题在存储库wiki中是可用的。快速入门确保你已经安装了 NVIDIA驱动程序和支持的用于你的发行版版本的 Docker 版本。如果你有一

安装使用NVIDIA-Docker——可使用GPU的Docker容器

m0_67390379的博客

04-28

1万+

参考网址： https://www.cnblogs.com/wuchangsoft/p/9767074.html nvidia-docker是一个可以使用GPU的docker，nvidia-docker是在docker上做了一层封装，通过nvidia-docker-plugin，然后调用到docker上，其最终实现的还是在docker的启动命令上携带一些必要的参数。因此在安装nvidia-docker之前，还是需要安装docker的。 docker一般都是使用基于CPU的应用，而如果是GPU的话，就需要安装

nvidia-docker配置深度学习环境服务器（cuda+cudnn+anaconda+python）

热门推荐

冰雪棋书的博客

12-08

4万+

1、查看内存：free -lh 2、内核：uname 3、显卡：nvidia-smi 4、cuda版本：nvcc -V 5、sudo nvidia-docker run 6、rancher 查看NVIDIA-Docker版本和docker版本：nvidia-docker version

docker nvidia-docker python pip安装

zly_kemgine的博客

05-22

589

docker 安装： Ubuntu:https://www.runoob.com/docker/ubuntu-docker-install.html nvidia-docker 安装： # If you have nvidia-docker 1.0 installed: we need to remove it and all existing GPU containers docker volume ls -q -f driver=nvidia-docker | xargs -r -I{} -..

ubuntu20.04下nvidia驱动安装，docker/nvidia-docker安装

01-29

2527

ubuntu20.04下nvidia驱动、docker、nvidia-docker安装、用户添加到docker组

nvidia-docker 使用

reno_yuan的博客

11-04

870

docker 17.03.2-ce 使用GPU

安装nvidia-docker

Siegelion001的博客

10-23

2482

完成这些步骤后，你就可以在 Docker 中使用 GPU 了！如果一切正常，你应该能看到 NVIDIA GPU 的信息。

docker 训练模型

12-31

### 如何在Docker容器中进行机器学习模型训练 #### 创建并配置Dockerfile 为了能够在Docker容器内顺利执行机器学习模型的训练过程，首先需要定义一个合适的`Dockerfile`文件来描述所需的软件环境以及安装必要的库和工具。对于基于PyTorch这样的深度学习框架而言，通常会指定基础映像为官方提供的GPU支持版本，并在此基础上添加额外的需求。 ```dockerfile FROM pytorch/pytorch:1.8.0-gpu WORKDIR /app COPY . . RUN pip install --no-cache-dir -r requirements.txt CMD ["python", "train.py"] ``` 此段代码展示了如何设置一个简单的Dockerfile以供后续构建镜像之用[^4]。 #### 下载预构建的基础镜像考虑到效率问题，在实际操作过程中往往会选择直接从公共仓库获取已经预先打包好的适合特定任务需求的基础镜像而非完全自定义整个环境。例如可以从阿里云拉取之前制作过的大型机器学习模型训练专用镜像： ```bash sudo docker pull registry.cn-hangzhou.aliyuncs.com/dink_framework/dink0.22:latest ``` 这条命令能够快速获得一个包含了所有必需组件的大约19GB大小的镜像文件[^2]。 #### 启动带有GPU加速功能的支持容器实例当涉及到利用图形处理器(GPU)来进行高效计算的任务时，则需确保所使用的Docker引擎具备相应的驱动程序支持。通过安装NVIDIA-Docker插件可以实现这一点，从而允许容器内部的应用访问宿主机上的CUDA资源完成更高效的运算处理。启动带GPU支持的容器可以通过如下方式实现: ```bash nvidia-docker run -it --rm \ -v $(pwd):/workspace \ dink_framework:dink0.22 bash ``` 上述指令不仅启用了GPU硬件加速特性还挂载了当前目录作为共享卷以便于数据交换与持久化存储。 #### 编写并测试训练脚本最后一步是在新建立起来的安全隔离环境中编写具体的Python或其他编程语言编写的训练逻辑代码。由于该阶段主要关注算法本身的设计优化而不涉及太多外部因素干扰因此相对独立简单得多。一旦完成了初步调试验证之后就可以考虑将其封装入到自动化流水线当中进一步提升生产力水平。