Kubernetes v1.8 对 GPU 的支持

本文详细介绍了在Kubernetes1.8环境下如何管理和使用GPU资源,包括必要的前提条件,如安装Nvidia驱动、kubelet配置、Nvidia-docker安装等。同时,文章也提到了GPU资源的限制和使用方式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

文章目录

针对 Kubernetes 1.8

在人工智能和深度学习领域,算法工程师对 GPU 的使用越来越多,因此用户也希望通过 Kubernetes 来为模型训练任务申请 GPU 资源。

Kubernetes 支持 GPU 有几个前提条件。

  1. 工作 Node 需要安装 Nvidia 的驱动程序
  2. 工作 Node 的 kubelet 需要在启动参数增加 --feature-gates="Accelerators=true"
  3. 工作 Node 安装 Nvidia-docker

alpha.kubernetes.io/nvdia-gpu 是 Nvidia GPU 的资源名称。

GPU 目前还有一些限制。

  1. 只能通过 limits 字段来配置,还不支持 request
  2. 容器和容器之间,以及 Pod 之间也不共享 GPU
  3. 容器只能请求整数个 GPU
  4. 集群需要运行相同型号的 GPU 硬件

容器需要访问 CUDA 库,一般来说 CUDA 库可以安装在工作 Node 上然后通过 hostPath 来挂载,又或者按照不同的 GPU 版本等在镜像里安装。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值