【K8s】etcd 常用命令

原创已于 2024-08-29 15:28:16 修改 · 2.7k 阅读

14 ·

CC 4.0 BY-SA版权

文章标签：

#kubernetes #etcd #云原生 #容器

于 2024-03-11 15:40:55 首次发布

Kubernetes 专栏收录该内容

56 篇文章

订阅专栏

本文内容均来自个人笔记并重新梳理，如有错误欢迎指正！

如果对您有帮助，烦请点赞、关注、转发、订阅专栏！

专栏订阅入口

Linux 专栏 | Docker 专栏 | Kubernetes 专栏

往期精彩文章

【Docker】（全网首发）Kylin V10 下 MySQL 容器内存占用异常的解决方法

【Docker】（全网首发）Kylin V10 下 MySQL 容器内存占用异常的解决方法（续）

【Docker】MySQL 源码构建 Docker 镜像（基于 ARM 64 架构）

前提

一、查询命令

1、查询 etcd 集群成员信息

2、查询 etcd 集群状态信息（version、leader等）

1、方式一（前提：etcd 的 pod 仍然正常运行）

2、方式二

3、方式三（方式一、方式二均失败时使用）

前提

使用 kubeadm 安装的 kubernetes 集群中，etcd 以静态 pod 的方式运行。

本文基于 kubernetes 集群介绍 etcd 相关命令，先通过以下命令获取相关信息作为变量：

# 获取当前 Master 节点主机名称
host=$(hostname)

# 获取 etcd 节点 pod 名称
etcd=$(kubectl get pod -n kube-system | grep 'Running' | grep etcd | head -n 1 | awk '{print $1}')

# 获取 etcd 目录
cert_dir="/etc/kubernetes/pki/etcd"

# 以上信息也可以从 /etc/kubernetes/manifests/etcd.yaml 中获取

一、查询命令

1、查询 etcd 集群成员信息

kubectl -n kube-system exec ${etcd} -- \
sh -c "ETCDCTL_API=3 etcdctl --endpoints=https://127.0.0.1:2379 --cert=${cert_dir}/server.crt --key=${cert_dir}/server.key --cacert=${cert_dir}/ca.crt member list -w table"

2、查询 etcd 集群状态信息（version、leader等）

# 仅查询当前节点
kubectl -n kube-system exec ${etcd} -- \
sh -c "ETCDCTL_API=3 etcdctl --endpoints=https://127.0.0.1:2379 --cert=${cert_dir}/server.crt --key=${cert_dir}/server.key --cacert=${cert_dir}/ca.crt endpoint status -w table"

# 查询所有节点
kubectl -n kube-system exec ${etcd} -- \
sh -c "ETCDCTL_API=3 etcdctl --endpoints=https://127.0.0.1:2379 --cert=${cert_dir}/server.crt --key=${cert_dir}/server.key --cacert=${cert_dir}/ca.crt endpoint status --cluster -w table"

3、查询 etcd 集群健康状态

# 仅查询当前节点
kubectl -n kube-system exec ${etcd} -- \
sh -c "ETCDCTL_API=3 etcdctl --endpoints=https://127.0.0.1:2379 --cert=${cert_dir}/server.crt --key=${cert_dir}/server.key --cacert=${cert_dir}/ca.crt endpoint health -w table"

# 查询所有节点
kubectl -n kube-system exec ${etcd} -- \
sh -c "ETCDCTL_API=3 etcdctl --endpoints=https://127.0.0.1:2379 --cert=${cert_dir}/server.crt --key=${cert_dir}/server.key --cacert=${cert_dir}/ca.crt endpoint health --cluster -w table"

4、查询所有 key

kubectl -n kube-system exec ${etcd} -- \
sh -c "ETCDCTL_API=3 etcdctl --endpoints=https://127.0.0.1:2379 --cert=${cert_dir}/server.crt --key=${cert_dir}/server.key --cacert=${cert_dir}/ca.crt get / --prefix --keys-only" | grep -v ^$

5、查询某个 key 对应的 value

kubectl -n kube-system exec ${etcd} -- \
sh -c "ETCDCTL_API=3 etcdctl --endpoints=https://127.0.0.1:2379 --cert=${cert_dir}/server.crt --key=${cert_dir}/server.key --cacert=${cert_dir}/ca.crt get <keyname>"

二、备份命令

# 备份至 /data/etcd/backup 目录
kubectl -n kube-system exec ${etcd} -- \
sh -c "ETCDCTL_API=3 etcdctl --endpoints=https://127.0.0.1:2379 --cert=${cert_dir}/server.crt --key=${cert_dir}/server.key --cacert=${cert_dir}/ca.crt snapshot save /data/etcd/backup/snap.db"

三、恢复命令

1、方式一（前提：etcd 的 pod 仍然正常运行）

# 直接通过 /data/etcd/backup 目录下的备份文件恢复，并指定新的数据目录
kubectl -n kube-system exec ${etcd} -- \
sh -c "ETCDCTL_API=3 etcdctl --name ${host} --initial-cluster=${host}=https://127.0.0.1:2380 --endpoints=https://127.0.0.1:2379 --cert=${cert_dir}/server.crt --key=${cert_dir}/server.key --cacert=${cert_dir}/ca.crt --initial-advertise-peer-urls=https://127.0.0.1:2380 snapshot restore /data/etcd/backup/snap.db --data-dir=/data/etcd/restore"

vi /etc/kubernetes/manifests/etcd.yaml，修改 data-dir 为 /data/etcd/restore，保存后 etcd 自动重启

2、方式二

cd /etc/kubernetes/manifests

# 停止服务
mv etcd.yaml etcd.yaml-b && mv kube-apiserver.yaml kube-apiserver.yaml-b

将 snap.db 拷贝至 /data/etcd/member/snap/db

# 启动服务
mv etcd.yaml-b etcd.yaml && mv kube-apiserver.yaml-b kube-apiserver.yaml

docker container prune -f（可能需要）

3、方式三（方式一、方式二均失败时使用）

cd /etc/kubernetes/manifests

# 停止服务
mv etcd.yaml etcd.yaml-b && mv kube-apiserver.yaml kube-apiserver.yaml-b

# 清除 etcd 数据
mv /data/etcd/member /tmp

# 启动服务
mv etcd.yaml-b etcd.yaml && mv kube-apiserver.yaml-b kube-apiserver.yaml

待etcd服务启动后，按照方式一（需要直接操作docker，且需要重启服务器）或者方式二的步骤进行操作