30天冲刺CKA认证：从零基础到实战高手的Kubernetes通关指南-优快云博客

30天冲刺CKA认证：从零基础到实战高手的Kubernetes通关指南

【免费下载链接】CKA-practice-exercises This is a guide for passing the CNCF Certified Kubernetes Administrator (CKA) with practice exercises. Good luck! 项目地址: https://gitcode.com/gh_mirrors/ck/CKA-practice-exercises

你是否正在为CNCF Certified Kubernetes Administrator (CKA)认证考试而焦虑？面对复杂的集群部署流程、层出不穷的故障排查场景，以及仅仅3小时的考试时间限制，你是否感到无从下手？本文将带你通过系统化训练，掌握CKA考试五大核心模块的实战技能，助你高效备考并顺利通过认证。

读完本文你将获得：

一套完整的CKA考试通关学习路径
五大核心模块的实战操作指南与代码示例
独家考试技巧与时间管理策略
真实场景故障排查模拟训练
可直接复用的Kubernetes资源配置模板库

CKA认证考试全景解析

CNCF (Cloud Native Computing Foundation，云原生计算基金会)的CKA认证是衡量Kubernetes管理员技能水平的行业标准。考试采用纯实操形式，要求在3小时内完成约24个任务，涵盖 Kubernetes 集群管理的各个方面。

考试内容分布

考试主题	占比	核心技能
集群架构、安装与配置	25%	Kubeadm部署、集群升级、高可用配置
工作负载与调度	15%	Deployment管理、滚动更新、调度策略
服务与网络	20%	Service类型、Ingress配置、网络策略
存储	10%	PV/PVC管理、存储类配置
故障排查	30%	节点问题、网络故障、应用部署问题诊断

考试环境与规则

CKA考试采用远程监考模式，考生需在个人电脑上完成考试，全程开启摄像头监控。考试期间：

仅允许访问Kubernetes官方文档(https://kubernetes.io/docs/)
可使用一个额外的浏览器标签页
桌面必须保持整洁，仅允许放置一瓶水
可申请休息，但考试时间不会暂停

核心模块实战训练

集群架构、安装与配置

使用Kubeadm部署基础集群

Kubeadm是官方推荐的集群部署工具，能够快速搭建生产可用的Kubernetes集群。以下是部署单控制平面集群的完整流程：

1. 安装容器运行时(Containerd)

# 配置内核模块
cat <<EOF | sudo tee /etc/modules-load.d/containerd.conf
overlay
br_netfilter
EOF

sudo modprobe overlay
sudo modprobe br_netfilter

# 配置系统参数
cat <<EOF | sudo tee /etc/sysctl.d/99-kubernetes-cri.conf
net.bridge.bridge-nf-call-iptables  = 1
net.ipv4.ip_forward                 = 1
net.bridge.bridge-nf-call-ip6tables = 1
EOF

sudo sysctl --system

# 安装Containerd
sudo apt-get update
sudo apt-get install -y apt-transport-https ca-certificates curl gnupg lsb-release
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /usr/share/keyrings/docker-archive-keyring.gpg
echo "deb [arch=amd64 signed-by=/usr/share/keyrings/docker-archive-keyring.gpg] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable" | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null
sudo apt-get update
sudo apt-get install -y containerd.io

# 配置Containerd
sudo mkdir -p /etc/containerd
containerd config default | sudo tee /etc/containerd/config.toml
sed -i 's/SystemdCgroup = false/SystemdCgroup = true/' /etc/containerd/config.toml
sudo systemctl restart containerd

2. 安装Kubernetes组件

# 配置Kubernetes仓库
sudo apt-get update
sudo apt-get install -y apt-transport-https ca-certificates curl
curl -fsSL https://pkgs.k8s.io/core:/stable:/v1.27/deb/Release.key | sudo gpg --dearmor -o /etc/apt/keyrings/kubernetes-apt-keyring.gpg
echo "deb [signed-by=/etc/apt/keyrings/kubernetes-apt-keyring.gpg] https://pkgs.k8s.io/core:/stable:/v1.27/deb/ /" | sudo tee /etc/apt/sources.list.d/kubernetes.list

# 安装kubeadm、kubelet和kubectl
sudo apt-get update
sudo apt-get install -y kubelet=1.27.5-1.1 kubeadm=1.27.5-1.1 kubectl=1.27.5-1.1
sudo apt-mark hold kubelet kubeadm kubectl

3. 初始化控制平面

# 在控制平面节点执行
sudo kubeadm init --kubernetes-version=1.27.5 --pod-network-cidr=10.244.0.0/16

# 配置kubectl访问
mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config

# 部署网络插件(Flannel)
kubectl apply -f https://raw.githubusercontent.com/flannel-io/flannel/v0.20.2/Documentation/kube-flannel.yml

4. 加入工作节点

# 在工作节点执行(命令来自kubeadm init输出)
sudo kubeadm join 172.16.1.11:6443 --token abcdef.0123456789abcdef \
  --discovery-token-ca-cert-hash sha256:1234567890abcdef1234567890abcdef1234567890abcdef1234567890abcdef

5. 验证集群状态

kubectl get nodes
NAME               STATUS   ROLES           AGE     VERSION
k8s-controlplane   Ready    control-plane   10m     v1.27.5
k8s-node-1         Ready    <none>          5m      v1.27.5
k8s-node-2         Ready    <none>          3m      v1.27.5

集群升级流程

Kubernetes集群升级需要遵循控制平面优先、逐节点升级的原则，以下是从v1.27升级到v1.28的详细步骤：

# 在控制平面节点
# 添加新版本仓库
sudo sh -c 'echo "deb [signed-by=/etc/apt/keyrings/kubernetes-apt-keyring.gpg] https://pkgs.k8s.io/core:/stable:/v1.28/deb/ /" >> /etc/apt/sources.list.d/kubernetes.list'

# 升级kubeadm
sudo apt-mark unhold kubeadm
sudo apt-get update && sudo apt-get install -y kubeadm=1.28.1-1.1
sudo apt-mark hold kubeadm

# 排空控制平面节点
kubectl drain k8s-controlplane --ignore-daemonsets

# 执行升级计划
sudo kubeadm upgrade plan

# 应用升级
sudo kubeadm upgrade apply v1.28.1

# 升级kubelet和kubectl
sudo apt-mark unhold kubelet kubectl
sudo apt-get update && sudo apt-get install -y kubelet=1.28.1-1.1 kubectl=1.28.1-1.1
sudo apt-mark hold kubelet kubectl
sudo systemctl daemon-reload
sudo systemctl restart kubelet

# 恢复节点调度
kubectl uncordon k8s-controlplane

# 在每个工作节点重复类似步骤
# ...

etcd数据备份与恢复

etcd是Kubernetes的数据库，定期备份至关重要：

# 备份etcd数据
sudo ETCDCTL_API=3 etcdctl snapshot save snapshot.db \
  --endpoints=https://127.0.0.1:2379 \
  --cacert=/etc/kubernetes/pki/etcd/ca.crt \
  --cert=/etc/kubernetes/pki/etcd/server.crt \
  --key=/etc/kubernetes/pki/etcd/server.key

# 查看备份状态
sudo ETCDCTL_API=3 etcdctl snapshot status snapshot.db \
  --cacert=/etc/kubernetes/pki/etcd/ca.crt \
  --cert=/etc/kubernetes/pki/etcd/server.crt \
  --key=/etc/kubernetes/pki/etcd/server.key

# 恢复数据(需先停止控制平面组件)
sudo ETCDCTL_API=3 etcdctl snapshot restore snapshot.db \
  --data-dir=/var/lib/etcd-backup \
  --endpoints=https://127.0.0.1:2379 \
  --cacert=/etc/kubernetes/pki/etcd/ca.crt \
  --cert=/etc/kubernetes/pki/etcd/server.crt \
  --key=/etc/kubernetes/pki/etcd/server.key

工作负载与调度

Deployment管理与版本控制

Deployment是管理无状态应用的主要方式，支持滚动更新和回滚：

# 创建Deployment
apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx-deploy
  namespace: ns-nginx
spec:
  replicas: 3
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
    spec:
      containers:
      - name: nginx
        image: nginx:1.22
        ports:
        - containerPort: 80

# 创建命名空间
kubectl create ns ns-nginx

# 应用Deployment配置
kubectl apply -f nginx-deploy.yaml -n ns-nginx

# 查看Deployment状态
kubectl get deploy -n ns-nginx
kubectl rollout status deployment/nginx-deploy -n ns-nginx

# 扩展Deployment
kubectl scale deployment nginx-deploy --replicas=5 -n ns-nginx

# 更新镜像版本
kubectl set image deployment/nginx-deploy nginx=nginx:1.23 -n ns-nginx

# 查看部署历史
kubectl rollout history deployment/nginx-deploy -n ns-nginx

# 回滚到上一版本
kubectl rollout undo deployment/nginx-deploy -n ns-nginx

# 回滚到特定版本
kubectl rollout undo deployment/nginx-deploy --to-revision=2 -n ns-nginx

配置资源限制与请求

合理设置资源请求和限制可避免资源争用：

apiVersion: v1
kind: Pod
metadata:
  name: resource-demo
spec:
  containers:
  - name: resource-demo-container
    image: nginx
    resources:
      requests:
        memory: "64Mi"
        cpu: "250m"
      limits:
        memory: "128Mi"
        cpu: "500m"

高级调度策略

Kubernetes提供多种调度策略满足复杂场景需求：

1. 节点选择器(NodeSelector)

apiVersion: v1
kind: Pod
metadata:
  name: pod-with-node-selector
spec:
  containers:
  - name: nginx
    image: nginx
  nodeSelector:
    disk: ssd
    environment: production

2. 亲和性与反亲和性

apiVersion: v1
kind: Pod
metadata:
  name: pod-with-affinity
spec:
  containers:
  - name: nginx
    image: nginx
  affinity:
    podAntiAffinity:
      requiredDuringSchedulingIgnoredDuringExecution:
      - labelSelector:
          matchExpressions:
          - key: app
            operator: In
            values:
            - database
        topologyKey: "kubernetes.io/hostname"

3. 污点与容忍

# 添加污点
kubectl taint nodes node-1 key=value:NoSchedule

# 在Pod中添加容忍

apiVersion: v1
kind: Pod
metadata:
  name: pod-with-toleration
spec:
  containers:
  - name: nginx
    image: nginx
  tolerations:
  - key: "key"
    operator: "Equal"
    value: "value"
    effect: "NoSchedule"

服务与网络

Service类型与使用场景

Kubernetes Service提供稳定网络端点，支持多种类型：

1. ClusterIP：仅集群内部访问

apiVersion: v1
kind: Service
metadata:
  name: my-clusterip-service
spec:
  selector:
    app: my-app
  ports:
  - port: 80
    targetPort: 8080
  type: ClusterIP

2. NodePort：暴露节点端口供外部访问

apiVersion: v1
kind: Service
metadata:
  name: my-nodeport-service
spec:
  selector:
    app: my-app
  ports:
  - port: 80
    targetPort: 8080
    nodePort: 30080
  type: NodePort

3. LoadBalancer：使用云服务商负载均衡器

apiVersion: v1
kind: Service
metadata:
  name: my-loadbalancer-service
spec:
  selector:
    app: my-app
  ports:
  - port: 80
    targetPort: 8080
  type: LoadBalancer

Ingress控制器与规则配置

Ingress提供HTTP/HTTPS路由、SSL终止等高级功能：

apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:
  name: minimal-ingress
spec:
  ingressClassName: nginx
  rules:
  - host: app.example.com
    http:
      paths:
      - path: /app1
        pathType: Prefix
        backend:
          service:
            name: app1-service
            port:
              number: 80
      - path: /app2
        pathType: Prefix
        backend:
          service:
            name: app2-service
            port:
              number: 80
  tls:
  - hosts:
    - app.example.com
    secretName: example-tls

安装与配置MetalLB

在裸金属环境中提供LoadBalancer功能：

# 安装MetalLB
kubectl apply -f https://raw.githubusercontent.com/metallb/metallb/v0.13.9/config/manifests/metallb-native.yaml

# 配置IP地址池

apiVersion: metallb.io/v1beta1
kind: IPAddressPool
metadata:
  name: first-pool
  namespace: metallb-system
spec:
  addresses:
  - 192.168.1.200-192.168.1.250
---
apiVersion: metallb.io/v1beta1
kind: L2Advertisement
metadata:
  name: example
  namespace: metallb-system
spec:
  ipAddressPools:
  - first-pool

存储

PV与PVC使用

PersistentVolume (PV)和PersistentVolumeClaim (PVC)提供持久化存储：

# 创建PV
apiVersion: v1
kind: PersistentVolume
metadata:
  name: my-pv
spec:
  capacity:
    storage: 10Gi
  accessModes:
    - ReadWriteOnce
  persistentVolumeReclaimPolicy: Retain
  storageClassName: slow
  hostPath:
    path: /data/pv-example

# 创建PVC
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  name: my-pvc
spec:
  accessModes:
    - ReadWriteOnce
  resources:
    requests:
      storage: 5Gi
  storageClassName: slow

# 在Pod中使用PVC
apiVersion: v1
kind: Pod
metadata:
  name: my-pod-with-pvc
spec:
  containers:
  - name: my-container
    image: nginx
    volumeMounts:
    - name: my-storage
      mountPath: /data
  volumes:
  - name: my-storage
    persistentVolumeClaim:
      claimName: my-pvc

StorageClass动态配置

StorageClass允许动态创建PV：

apiVersion: storage.k8s.io/v1
kind: StorageClass
metadata:
  name: fast
provisioner: kubernetes.io/aws-ebs
parameters:
  type: gp2
reclaimPolicy: Delete
allowVolumeExpansion: true

故障排查

节点健康检查

# 检查节点状态
kubectl get nodes
kubectl describe node <node-name>

# 查看节点资源使用情况
kubectl top nodes

# 检查kubelet状态
systemctl status kubelet

# 查看kubelet日志
journalctl -u kubelet -f

# 检查节点网络连接
kubectl exec -it <pod-name> -- ping <ip-address>
kubectl exec -it <pod-name> -- nslookup <service-name>

控制平面组件故障排查

# 查看控制平面Pod状态
kubectl get pods -n kube-system

# 查看API Server日志
kubectl logs -n kube-system kube-apiserver-<node-name>

# 查看Controller Manager日志
kubectl logs -n kube-system kube-controller-manager-<node-name>

# 查看Scheduler日志
kubectl logs -n kube-system kube-scheduler-<node-name>

Pod故障排查流程

# 检查Pod状态
kubectl get pods
kubectl describe pod <pod-name>

# 查看Pod日志
kubectl logs <pod-name>
kubectl logs <pod-name> -c <container-name>
kubectl logs <pod-name> --previous

# 进入Pod调试
kubectl exec -it <pod-name> -- /bin/bash

# 检查Pod网络
kubectl exec -it <pod-name> -- ifconfig
kubectl exec -it <pod-name> -- netstat -tulpn

# 查看事件
kubectl get events --sort-by='.lastTimestamp'

考试策略与时间管理

关键成功因素

官方文档熟练度：考试允许访问kubernetes.io/docs，需熟悉文档结构，快速定位所需内容
命令行效率：使用kubectl别名、自动补全功能提高操作速度
资源准备：提前准备常用配置模板，考试时可快速修改使用
时间分配：根据题目分值分配时间，先易后难，不要在难题上过度纠缠

必备kubectl技巧

# 设置kubectl自动补全
source <(kubectl completion bash)
echo "source <(kubectl completion bash)" >> ~/.bashrc

# 创建常用别名
alias k=kubectl
alias kgp='kubectl get pods'
alias kgs='kubectl get services'
alias kgd='kubectl get deployments'
alias kd='kubectl describe'
alias kc='kubectl create'
alias ka='kubectl apply -f'

# 使用--dry-run生成配置
kubectl run nginx --image=nginx --dry-run=client -o yaml > nginx-pod.yaml

# 编辑正在运行的资源
kubectl edit deployment <deployment-name>

# 查看资源字段说明
kubectl explain pods.spec.containers

30天备考计划

第1-5天：基础架构与安装

每日目标：搭建2个不同版本的Kubernetes集群
重点练习：Kubeadm部署、组件配置、节点加入/移除

第6-10天：工作负载管理

每日目标：创建并管理10个不同类型的Deployment
重点练习：版本更新、回滚、扩缩容、资源限制

第11-15天：服务与网络

每日目标：配置5种不同网络场景
重点练习：Service类型配置、Ingress规则、网络策略

第16-20天：存储管理

每日目标：实现4种存储方案
重点练习：PV/PVC配置、StorageClass、动态供应

第21-25天：故障排查

每日目标：模拟并解决10个故障场景
重点练习：日志分析、组件恢复、网络诊断

第26-30天：综合实战

每日目标：完成2套模拟试题
重点练习：时间管理、考试策略、快速解题

总结与展望

通过本文介绍的系统化学习路径和实战练习，你将能够在30天内掌握CKA认证所需的核心技能。记住，CKA不仅是一张证书，更是对Kubernetes管理能力的全面检验。持续实践是掌握Kubernetes的关键，考试通过只是你云原生之旅的开始。

随着云原生技术的不断发展，Kubernetes管理员的需求将持续增长。通过CKA认证，你将为自己的职业发展打开新的大门。祝你考试顺利，成为一名优秀的Kubernetes管理员！

行动倡议：

立即开始搭建你的第一个Kubernetes集群
每天至少完成3个实战练习
加入CKA备考社区，与同行交流经验
关注Kubernetes官方文档更新

下期预告：Kubernetes高级管理技巧与最佳实践，深入探讨生产环境集群优化策略。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考