ubuntu安装k8s+docker运行英伟达gpu cuda

 安装k8s+docker

sealos reset

sealos run registry.cn-shanghai.aliyuncs.com/labring/kubernetes-docker:v1.27.7 registry.cn-shanghai.aliyuncs.com/labring/helm:v3.9.4 registry.cn-shanghai.aliyuncs.com/labring/cilium:v1.13.4 --single
英伟达Ubuntu驱动下载地址:https://us.download.nvidia.cn/XFree86/Linux-x86_64/550.78/NVIDIA-Linux-x86_64-550.78.run

./NVIDIA-Linux-x86_64-550.78.run

nvidia-smi

Fri Jul 12 23:18:31 2024       
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 550.78                 Driver Version: 550.78         CUDA Version: 12.4     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA GeForce GTX 1060 6GB    Off |   00000000:02:00.0  On |                  N/A |
| 38%   39C    P8              8W /  150W |     273MiB /   6144MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+
                                                                                         
+-----------------------------------------------------------------------------------------+
| Processes:                                                                              |
|  GPU   GI   CI        PID   Type   Process name                              GPU Memory |
|        ID   ID                                                               Usage      |
|===&
### 在 Ubuntu 22.04安装和配置 KubeSphere 容器平台 #### 准备工作 为了在 Ubuntu 22.04 上成功安装和配置 KubeSphere,需要完成以下准备工作: 1. **确保系统环境满足最低要求** 确认操作系统为 Ubuntu 22.04 LTS,并且已更新至最新状态。可以通过运行以下命令来升级系统软件包: ```bash sudo apt update && sudo apt upgrade -y ``` 2. **安装 Docker 和 CRI-Dockerd** Kubernetes 使用容器运行时接口 (CRI),而默认情况下 Docker 不支持此接口。因此需要安装 `cri-dockerd` 来兼容 Docker 运行时[^3]。 下载并安装适合 Ubuntu 的 `.deb` 包: ```bash wget https://github.com/Mirantis/cri-dockerd/releases/download/v0.3.4/cri-dockerd_0.3.4.3-0.ubuntu-jammy_amd64.deb sudo dpkg -i cri-dockerd_0.3.4.3-0.ubuntu-jammy_amd64.deb ``` 修改启动参数以适配 Kubernetes 需求: ```bash sudo sed -i -e 's#ExecStart=.*#ExecStart=/usr/bin/cri-dockerd --container-runtime-endpoint unix:///var/run/cri-dockerd.sock --network-plugin=cni --pod-infra-container-image=registry.aliyuncs.com/google_containers/pause:3.7#g' /lib/systemd/system/cri-docker.service systemctl daemon-reload systemctl restart cri-docker.service ``` 3. **安装 CNI 插件** Kubernetes 需要网络插件才能正常通信。可以从官方仓库下载最新的 CNI 插件版本[^4]。 ```bash mkdir -p /opt/cni/bin/ cd ~ curl -L https://github.com/containernetworking/plugins/releases/download/v0.8.6/cni-plugins-linux-amd64-v0.8.6.tgz | tar -xzv -C /opt/cni/bin/ ``` --- #### 安装 Kubernetes Kubernetes 是 KubeSphere 的基础依赖项,需先安装 Kubernetes 并初始化集群。 1. 添加 Kubernetes APT 存储库: ```bash curl -fsSL https://packages.cloud.google.com/apt/doc/apt-key.gpg | sudo gpg --dearmor -o /etc/apt/keyrings/kubernetes-archive-keyring.gpg echo "deb [signed-by=/etc/apt/keyrings/kubernetes-archive-keyring.gpg] https://apt.kubernetes.io/ kubernetes-xenial main" | sudo tee /etc/apt/sources.list.d/kubernetes.list sudo apt-get update ``` 2. 安装 kubelet、kubeadm 和 kubectl: ```bash sudo apt install -y kubelet kubeadm kubectl sudo apt-mark hold kubelet kubeadm kubectl ``` 3. 初始化 Kubernetes 集群: ```bash sudo swapoff -a sudo kubeadm init --pod-network-cidr=10.244.0.0/16 ``` 4. 配置 kubectl 访问权限: ```bash mkdir -p $HOME/.kube sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config sudo chown $(id -u):$(id -g) $HOME/.kube/config ``` 5. 安装 Flannel 网络插件: ```bash kubectl apply -f https://raw.githubusercontent.com/coreos/flannel/master/Documentation/kube-flannel.yml ``` --- #### 安装 KubeSphere 完成上述步骤后即可开始安装 KubeSphere。 1. 获取 KubeSphere 安装脚本: ```bash curl -sfL https://get-kubesphere.io/shell.sh | sh - ``` 2. 执行安装命令: ```bash ks-installer install --all ``` 3. 查看安装进度: 登录到任意一个节点并通过浏览器访问 KubeSphere 控制台,默认地址为 `<Node IP>:30880`。初始用户名为 `admin`,密码可通过以下命令获取: ```bash kubectl logs -n kubesphere-system $(kubectl get pod -n kubesphere-system -l app=ks-install -o jsonpath='{.items[0].metadata.name}') -c ks-install ``` --- #### 测试部署应用 验证 KubeSphere 是否能够正常管理 Kubernetes 应用程序。按照指引将 Nginx Web 服务器作为测试负载部署到集群中[^2]: ```yaml apiVersion: apps/v1 kind: Deployment metadata: name: nginx-deployment spec: replicas: 2 selector: matchLabels: app: nginx template: metadata: labels: app: nginx spec: containers: - name: nginx image: nginx:latest ports: - containerPort: 80 --- apiVersion: v1 kind: Service metadata: name: nginx-service spec: type: NodePort selector: app: nginx ports: - protocol: TCP port: 80 targetPort: 80 ``` 保存文件为 `nginx.yaml` 后执行以下命令创建资源: ```bash kubectl apply -f nginx.yaml ``` --- ### 注意事项 - 如果遇到任何错误日志,请检查 `/var/log/syslog` 或者通过 `journalctl -xe` 命令排查问题。 - 对于多节点集群场景,还需额外配置各节点间的 SSH 密钥免密登录以及时间同步服务。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值