kubernetes初始化失败

1. 彻底清理 Kubernetes 残留痕迹

原因
残留的配置文件、静态 Pod 清单和网络配置会导致初始化冲突。kubeadm reset 可能未完全清理环境。

操作

# 重置 kubeadm 并强制清理
sudo kubeadm reset -f

# 手动删除所有残留文件
sudo rm -rf \
  /etc/kubernetes \
  /var/lib/etcd \
  /var/lib/kubelet \
  /etc/cni/net.d \
  /etc/systemd/system/kubelet.service.d \
  $HOME/.kube

# 强制删除可能残留的静态 Pod 清单(关键!)
sudo find /etc/kubernetes/manifests -type f -name '*.yaml' -delete

2. 解除端口 10250 占用

原因
端口被占用通常由未完全退出的 kubelet 或残留容器引起。

操作

# 查找并终止占用 10250 端口的进程
sudo ss -tulnp | grep 10250
sudo kill -9 <PID>  # 根据输出结果替换 <PID>

# 确保 kubelet 完全停止
sudo systemctl stop kubelet

# 清理容器运行时残留
sudo crictl rm -f $(sudo crictl ps -aq) 2>/dev/null

3. 修复 kubelet 服务配置

原因
cgroup 驱动不一致或证书错误会导致 kubelet 无法启动。

操作

# 检查 kubelet 配置
sudo grep cgroupDriver /var/lib/kubelet/config.yaml

# 如果输出不是 `systemd`,修复配置
sudo sed -i 's/cgroupDriver: cgroupfs/cgroupDriver: systemd/' /var/lib/kubelet/config.yaml

# 重启服务
sudo systemctl daemon-reload
sudo systemctl restart kubelet

4. 验证容器运行时 (containerd) 配置

原因
containerd 的 cgroup 驱动或镜像仓库配置错误会导致控制平面组件无法启动。

操作

# 确认 containerd 使用 systemd cgroup 驱动
sudo grep SystemdCgroup /etc/containerd/config.toml
# 输出应为:SystemdCgroup = true

# 如果未配置,修复后重启
sudo sed -i 's/SystemdCgroup = false/SystemdCgroup = true/' /etc/containerd/config.toml
sudo systemctl restart containerd

# 手动拉取镜像测试
sudo crictl pull registry.aliyuncs.com/google_containers/kube-apiserver:v1.27.16

5. 使用强制模式重新初始化集群

原因
标准初始化流程可能被残留配置干扰,需强制覆盖。

操作

# 初始化命令(添加 --ignore-preflight-errors 跳过残留文件检查)
sudo kubeadm init \
  --config kubeadm-config.yaml \
  --upload-certs \
  --ignore-preflight-errors=FileAvailable--etc-kubernetes-manifests-*

# 如果仍报端口占用,强制释放
sudo lsof -i :10250 | awk 'NR!=1 {print $2}' | xargs sudo kill -9

6. 关键配置验证
检查项命令预期结果
kubelet 服务状态systemctl status kubeletActive: active (running)
控制平面容器状态crictl ps | grep 'kube-apiserver'所有组件处于 Running 状态
端口占用情况ss -tulnp | grep 10250无输出
镜像完整性crictl images | grep 'google_containers'显示所有 v1.27.16 版本镜像

后续步骤

  1. 部署网络插件(如 Calico):

    kubectl apply -f https://docs.projectcalico.org/manifests/calico.yaml

  2. 恢复环境

    mkdir -p $HOME/.kube
    sudo cp /etc/kubernetes/admin.conf $HOME/.kube/config
    sudo chown $(id -u):$(id -g) $HOME/.kube/config

若仍失败:深度排查

  1. 查看 kubelet 详细日志:

    journalctl -xeu kubelet --no-pager | grep -i -E "error|fail|crash"
  2. 检查控制平面组件日志:

    crictl ps -a | grep -E "kube-apiserver|etcd"
    crictl logs <CONTAINER_ID>
  3. 使用调试模式初始化:

    kubeadm init --v=5  # 输出级别调至最高
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值