kubernetes 1.24 使用nvidia gpu 单机/集群

本文详细介绍了如何在kubernetes 1.24环境中安装和配置nvidia-gpu支持。首先,文章涵盖了k8s集群的安装步骤,包括服务器配置、关闭swap、安装containerd以及kubernetes组件。然后,重点讲解了nvidia软件的安装过程,如安装nvidia-container-runtime和修改containerd配置。最后,通过运行一个任务来验证GPU功能的正确性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1 k8s集群安装

服务器配置

域名设置好,端口号要开下。命令略了

sudo apt-get update \
   && sudo apt-get install -y apt-transport-https \
      ca-certificates curl software-properties-common

关swap

swapoff -a
sed -ri 's/.*swap.*/#&/' /etc/fstab

ipv4流量转到iptables:

cat <<EOF | sudo tee /etc/modules-load.d/containerd.conf
overlay
br_netfilter
EOF

sudo modprobe overlay \
   && sudo modprobe br_netfilter

cat <<EOF | sudo tee /etc/sysctl.d/99-kubernetes-cri.conf
net.bridge.bridge-nf-call-iptables  = 1
net.ipv4.ip_forward                 = 1
net.bridge.bridge-nf-call-ip6tables = 1
EOF


sudo sysctl --system

安装containerd

curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key --keyring /etc/apt/trusted.gpg.d/docker.gpg add -

sudo add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/ubuntu \
(lsb_release -cs) \
   stable"
   
sudo apt-get update \
   && sudo apt-get install -y containerd.io

生成containerd默认配置并修改重启

mkdir -p /etc/containerd/
containerd config default > /etc/containerd/config.toml

# 添加一行配置
[plugins."io.containerd.grpc.v1.cri".containerd.runtimes.runc.options]
   SystemdCgroup 
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值