一文讲透Kubernetes基础原理（含图解+实战案例，仅限内部分享）

原创于 2025-10-16 18:52:37 发布 · 727 阅读

9 ·

CC 4.0 BY-SA版权

部署运行你感兴趣的模型镜像

第一章：Kubernetes基础概念

Kubernetes 是一个开源的容器编排平台，用于自动化部署、扩展和管理容器化应用。它将多个主机组合成一个集群，统一调度计算、存储和网络资源，实现高可用性和弹性伸缩。

核心组件架构

Kubernetes 集群由控制平面（Control Plane）和工作节点（Node）组成。控制平面负责全局决策，如调度和检测集群状态；工作节点运行实际的容器化应用。主要组件包括：

API Server：提供 Kubernetes API，是所有操作的入口点
etcd：轻量级、高可用的键值存储，保存集群所有配置数据
Kubelet：运行在每个节点上，确保容器按预期运行
Controller Manager：运行控制器进程，如节点控制器、副本控制器
Scheduler：负责将 Pod 调度到合适的节点上

关键对象模型

Kubernetes 使用声明式 API 管理资源对象。最核心的对象是 Pod，它是可调度的最小单元，通常封装一个或多个紧密关联的容器。

对象	描述
Pod	最小部署单元，包含一个或多个共享网络和存储的容器
Service	为 Pod 提供稳定的网络访问入口
Deployment	声明式地管理 Pod 副本和更新策略

部署示例

以下是一个简单的 Nginx Deployment 定义：

apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx-deployment
spec:
  replicas: 3
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
    spec:
      containers:
      - name: nginx
        image: nginx:1.21
        ports:
        - containerPort: 80

该 YAML 文件定义了一个包含三个副本的 Deployment，每个 Pod 运行一个 Nginx 容器。通过 kubectl apply -f 部署后，Kubernetes 将确保始终有三个 Nginx 实例运行。

graph TD A[User] -->|kubectl apply| B(API Server) B --> C[etcd] C --> D[Scheduler] D --> E[Kubelet] E --> F[Running Pods]

第二章：核心组件与架构解析

2.1 Master节点组件详解：理论与配置实践

Master节点是Kubernetes集群的核心控制平面，负责集群的管理与调度。其主要组件包括API Server、etcd、Controller Manager、Scheduler和可选的高可用组件。

核心组件职责

API Server：集群的唯一入口，提供REST接口与认证授权机制
etcd：轻量级分布式键值存储，保存集群所有状态数据
Controller Manager：运行控制器进程，如Node Controller、Replication Controller
Scheduler：负责Pod调度，依据资源需求与策略选择最优节点

API Server启动配置示例

kube-apiserver \
  --etcd-servers=http://127.0.0.1:2379 \
  --secure-port=6443 \
  --advertise-address=192.168.1.10 \
  --allow-privileged=true \
  --client-ca-file=/etc/kubernetes/pki/ca.crt

上述参数中，--etcd-servers指定后端存储地址，--secure-port设置HTTPS服务端口，--advertise-address为集群其他组件可见的IP，确保通信可达。

2.2 Node节点与Kubelet工作机制剖析

在Kubernetes集群中，Node是工作节点的抽象，负责运行容器化应用。每个Node上运行的核心组件是Kubelet，它负责与Master节点通信，接收Pod调度指令并确保容器按期望状态运行。

Kubelet核心职责

监听API Server下发的PodSpec，并管理对应Pod的生命周期
调用容器运行时（如containerd）创建、启动、停止容器
定期上报节点状态和Pod运行情况至API Server

典型Kubelet配置参数

参数	说明
--node-ip	指定节点IP地址
--pod-infra-container-image	Pod基础容器镜像
--kubeconfig	连接API Server的认证配置文件

Pod同步流程示例

// 简化版Kubelet SyncLoop伪代码
for {
    select {
    case update := <-podUpdates:
        // 接收Pod更新事件
        kubelet.syncPod(update)
    case <-periodicSync:
        // 定期从API Server拉取最新状态
        kubelet.syncPeriodic()
    }
}

该循环机制确保本地Pod状态与API Server保持最终一致性，通过事件驱动与周期性同步结合的方式提升可靠性。

2.3 Pod生命周期管理与实战部署案例

Pod是Kubernetes中最小的调度和管理单元，其生命周期从Pending开始，经历Running、Succeeded或Failed状态。理解Pod的各个阶段对保障应用稳定性至关重要。

Pod生命周期核心阶段

Pending：Pod已创建，但容器尚未启动
Running：Pod已绑定到节点，容器全部启动
Succeeded/Failed：所有容器终止，后者表示至少一个容器失败

实战部署示例

apiVersion: v1
kind: Pod
metadata:
  name: nginx-pod
spec:
  containers:
  - name: nginx
    image: nginx:1.25
    ports:
    - containerPort: 80
    lifecycle:
      postStart:
        exec:
          command: ["/bin/sh", "-c", "echo Hello from postStart > /usr/share/nginx/index.html"]

该配置在容器启动后自动写入自定义页面内容，postStart钩子确保初始化逻辑在容器启动后立即执行，适用于配置注入或健康预热场景。

2.4 Service网络模型与服务发现原理

Kubernetes中的Service为Pod提供稳定的网络访问入口，通过标签选择器（selector）关联后端Pod实例。Service通过iptables或IPVS规则将请求转发至实际Pod。

服务发现机制

集群内服务通过DNS实现自动服务发现。每个Service注册为一个DNS名称，格式为my-svc.my-namespace.svc.cluster.local。

Service类型对比

类型	访问范围	典型用途
ClusterIP	集群内部	内部微服务通信
NodePort	节点IP暴露端口	外部测试访问
LoadBalancer	云厂商负载均衡器	生产环境公网访问

apiVersion: v1
kind: Service
metadata:
  name: nginx-service
spec:
  selector:
    app: nginx
  ports:
    - protocol: TCP
      port: 80
      targetPort: 80
  type: ClusterIP

上述配置定义了一个名为nginx-service的Service，将集群内对80端口的请求转发到带有app=nginx标签的Pod的80端口上，实现稳定的服务访问。

2.5 etcd在集群状态存储中的作用与操作示例

etcd是Kubernetes集群的核心组件，负责持久化存储集群的配置数据与实时状态。它采用Raft一致性算法确保高可用与数据一致性。

核心功能

存储节点、Pod、服务等资源对象的状态
支持分布式锁与领导者选举
提供可靠的键值存储接口

基本操作示例


# 写入键值
etcdctl put /k8s/config '{"replicas":3}'

# 读取数据
etcdctl get /k8s/config

# 监听变更
etcdctl watch /k8s/config

上述命令分别实现配置写入、查询与实时监听。其中put用于更新状态，get获取当前值，watch则建立长连接监听路径变化，支撑控制器的反应式编程模型。

第三章：资源对象与声明式API

3.1 Deployment控制器的应用与滚动更新实战

Deployment基础定义与作用

Deployment是Kubernetes中用于管理无状态应用的核心控制器，通过声明式配置实现Pod的自动化部署、扩缩容与更新。

创建带版本控制的Deployment

apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx-deploy
spec:
  replicas: 3
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
    spec:
      containers:
      - name: nginx
        image: nginx:1.21
        ports:
        - containerPort: 80

该配置定义了一个运行Nginx 1.21的Deployment，初始副本数为3。关键字段`image: nginx:1.21`为后续滚动更新提供版本锚点。

执行滚动更新并监控过程

使用kubectl set image deployment/nginx-deploy nginx=nginx:1.25触发更新。Kubernetes会逐步替换旧Pod，确保服务不中断。可通过kubectl rollout status deployment/nginx-deploy实时查看更新进度。

3.2 ConfigMap与Secret的配置管理实践

在Kubernetes中，ConfigMap与Secret是实现配置与代码分离的核心资源对象。前者用于存储非敏感配置数据，后者则专为密码、令牌等敏感信息设计。

ConfigMap的基本使用

通过键值对方式定义配置，可在Pod中以环境变量或卷挂载形式注入：

apiVersion: v1
kind: ConfigMap
metadata:
  name: app-config
data:
  LOG_LEVEL: "debug"
  DB_URL: "localhost:5432"

该配置可被Deployment引用，实现灵活的环境差异化设置。

Secret的安全管理

Secret需将数据Base64编码，确保敏感信息加密存储：

apiVersion: v1
kind: Secret
metadata:
  name: db-secret
type: Opaque
data:
  password: MWYyZDFlMmU2N2Rm # Base64编码后的值

Pod通过volumeMounts或envFrom方式安全读取，避免硬编码风险。

特性	ConfigMap	Secret
数据类型	明文配置	敏感数据
存储方式	直接存储	Base64编码

3.3 Namespace与资源隔离策略应用

在容器化环境中，Namespace 是实现资源隔离的核心机制之一。通过不同类型的 Namespace，可以对进程、网络、文件系统等资源进行逻辑隔离。

Namespace 类型及其作用

PID Namespace：隔离进程 ID 空间，使容器内进程无法查看宿主机或其他容器的进程。
Network Namespace：独立的网络栈，包括接口、路由表和端口空间。
MNT Namespace：文件系统挂载点隔离，实现容器独立的文件视图。

代码示例：创建隔离的网络命名空间

ip netns add container-net
ip link add veth0 type veth peer name veth1
ip link set veth1 netns container-net
ip netns exec container-net ip addr add 192.168.1.10/24 dev veth1

上述命令创建名为 container-net 的网络命名空间，并配置虚拟以太网设备进行通信。其中 ip netns exec 允许在指定命名空间中执行命令，实现网络资源的逻辑隔离。

第四章：调度机制与网络模型

4.1 节点选择与污点容忍调度策略实战

在 Kubernetes 集群中，节点选择（Node Selection）和污点容忍（Taints and Tolerations）机制是实现工作负载精准调度的核心手段。通过合理配置，可将特定 Pod 调度到符合硬件或环境要求的节点上。

节点亲和性配置示例

apiVersion: v1
kind: Pod
metadata:
  name: nginx-pod
spec:
  affinity:
    nodeAffinity:
      requiredDuringSchedulingIgnoredDuringExecution:
        nodeSelectorTerms:
        - matchExpressions:
          - key: disktype
            operator: In
            values:
            - ssd

上述配置确保 Pod 仅能调度到标签为 disktype=ssd 的节点。其中 requiredDuringScheduling 表示硬性约束，不满足则不调度。

污点与容忍机制

使用 kubectl taint 可为节点设置污点：

kubectl taint nodes node-1 dedicated=special-user:NoSchedule

Pod 需添加对应容忍才能调度：

tolerations:
- key: "dedicated"
  operator: "Equal"
  value: "special-user"
  effect: "NoSchedule"

该容忍允许 Pod 忽略污点影响，实现受控调度。

4.2 自定义调度器开发与集成案例

在复杂分布式系统中，通用调度策略难以满足特定业务场景的性能需求，因此自定义调度器成为优化资源分配的关键手段。通过扩展 Kubernetes Scheduler Framework，开发者可注入自定义的过滤与打分逻辑。

调度器扩展点实现

核心在于实现 `Filter` 和 `Score` 插件接口：

type CustomFilter struct{}

func (cf *CustomFilter) Filter(ctx context.Context, state *framework.CycleState, pod *v1.Pod, nodeInfo *framework.NodeInfo) *framework.Status {
    if nodeInfo.Node().Labels["dedicated"] == "gpu" && !hasGPUDemand(pod) {
        return framework.NewStatus(framework.Unschedulable, "node reserved for GPU workloads")
    }
    return framework.NewStatus(framework.Success, "")
}

上述代码拦截非GPU需求Pod向专用节点的调度。`Filter` 方法返回 `Unschedulable` 表示该节点不满足条件，`Success` 则进入打分阶段。

配置与部署

通过 KubeSchedulerConfiguration 将插件注册至调度器，并以静态 Pod 方式部署，确保集群级生效。此机制支持热更新配置，提升运维灵活性。

4.3 CNI网络插件原理与Flannel部署实操

CNI（Container Network Interface）是Kubernetes中实现容器网络的标准接口，通过插件化方式为Pod分配IP并实现跨节点通信。Flannel作为轻量级CNI插件，采用VXLAN或Host-GW模式构建覆盖网络。

Flannel工作原理

Flannel在每个Node上分配唯一的子网段，Pod启动时由kubelet调用CNI插件为其配置IP和路由。后端支持VXLAN封装跨主机通信，或使用Host-GW直连三层网络。

部署Flannel实例

apiVersion: v1
kind: ConfigMap
metadata:
  name: kube-flannel-cfg
  namespace: kube-system
data:
  cni-conf.json: |
    {
      "name": "cbr0",
      "plugins": [
        {
          "type": "flannel",
          "delegate": { "hairpinMode": true }
        }
      ]
    }

该配置定义CNI网络配置，指定flannel接管Pod网络，并启用代理模式处理ARP和流量反射。通过kubectl apply -f部署后，DaemonSet确保每个节点运行flannel Pod，自动配置路由表与VTEP隧道。

4.4 Service通信与Ingress流量入口控制实践

在Kubernetes中，Service提供稳定的网络端点实现Pod间通信。通过ClusterIP、NodePort和LoadBalancer类型可灵活控制服务暴露方式。对于外部流量接入，Ingress成为主流方案，集中管理HTTP/HTTPS路由规则。

Ingress控制器配置示例

apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:
  name: example-ingress
  annotations:
    nginx.ingress.kubernetes.io/rewrite-target: /$1
spec:
  rules:
  - host: app.example.com
    http:
      paths:
      - path: /api(/|$)(.*)
        pathType: Prefix
        backend:
          service:
            name: api-service
            port:
              number: 80

上述配置将请求路径以/api开头的流量重写并转发至后端api-service，利用Nginx Ingress控制器实现路径路由与主机名匹配。

Service类型对比

类型	访问范围	典型用途
ClusterIP	集群内部	内部服务通信
NodePort	节点IP+端口	临时暴露服务
LoadBalancer	外部负载均衡器	生产环境公网访问

第五章：总结与进阶学习路径

构建可扩展的微服务架构

在实际项目中，采用 Go 语言构建微服务时，推荐使用 gRPC 进行服务间通信。以下是一个简单的 gRPC 客户端调用示例：


// 建立连接
conn, err := grpc.Dial("localhost:50051", grpc.WithInsecure())
if err != nil {
    log.Fatalf("did not connect: %v", err)
}
defer conn.Close()
client := pb.NewUserServiceClient(conn)

// 发起请求
ctx, cancel := context.WithTimeout(context.Background(), time.Second)
defer cancel()
resp, err := client.GetUser(ctx, &pb.UserRequest{Id: 1})
if err != nil {
    log.Fatalf("could not get user: %v", err)
}
fmt.Printf("User: %s\n", resp.Name)