揭秘Kubernetes核心组件：10分钟彻底搞懂Pod、Service与Deployment

原创于 2025-10-16 18:33:57 发布 · 722 阅读

20 ·

CC 4.0 BY-SA版权

部署运行你感兴趣的模型镜像

第一章：Kubernetes基础概念与架构概述

Kubernetes 是一个开源的容器编排平台，用于自动化部署、扩展和管理容器化应用。其核心设计理念是将集群中的物理或虚拟资源抽象为可调度的计算单元，从而实现高效、可靠的分布式服务管理。

核心组件架构

Kubernetes 集群由控制平面（Control Plane）和工作节点（Node）组成。控制平面负责集群的全局管理和决策，包括 API Server、etcd、Scheduler 和 Controller Manager。工作节点运行实际的工作负载，包含 Kubelet、Kube-proxy 和容器运行时。以下是典型控制平面组件的功能说明：

API Server：提供 Kubernetes 的 REST API，是所有操作的入口点
etcd：轻量级、分布式的键值存储，保存集群的全部配置数据
Scheduler：根据资源需求和策略选择合适的节点部署 Pod
Controller Manager：运行各种控制器，如节点控制器、副本控制器等

关键抽象对象

Kubernetes 使用声明式 API 来管理应用状态。最核心的抽象是 Pod，它是调度的最小单元，通常封装一个或多个紧密关联的容器。

对象	描述
Pod	最小部署单元，共用网络和存储命名空间的一组容器
Service	定义稳定的网络端点，用于访问一组 Pod
Deployment	声明式地管理 Pod 副本和更新策略

集群通信示例

在节点上，Kubelet 负责与 API Server 通信并维护 Pod 状态：

apiVersion: v1
kind: Pod
metadata:
  name: nginx-pod
spec:
  containers:
  - name: nginx
    image: nginx:latest
    ports:
    - containerPort: 80

该 YAML 定义了一个运行 Nginx 的 Pod，通过 Kubelet 在节点上拉取镜像并启动容器。API Server 接收请求后，经调度器分配节点，最终由目标节点上的 Kubelet 执行创建操作。

第二章：深入解析Pod——Kubernetes的最小调度单元

2.1 Pod的核心原理与生命周期管理

Pod的基本结构与核心原理

Pod是Kubernetes中最小的调度与部署单元，它封装了一个或多个紧密关联的容器，共享网络命名空间、存储卷和IP地址。多个容器在同一个Pod中可实现高效通信，适用于主从应用、日志收集等场景。

Pod的生命周期阶段

Pod的生命周期包含五个主要阶段（Phase）：

Pending：Pod已创建，但容器尚未启动；
Running：Pod已调度到节点，所有容器正在运行；
Succeeded：所有容器成功执行并退出；
Failed：至少一个容器以失败结束；
Unknown：状态无法获取。

生命周期钩子与示例

Kubernetes提供PostStart和PreStop钩子，用于在容器生命周期关键点执行自定义逻辑：

lifecycle:
  postStart:
    exec:
      command: ["/bin/sh", "-c", "echo 'Container started' >> /var/log/lifecycle.log"]
  preStop:
    httpGet:
      path: /shutdown
      port: 8080

上述配置在容器启动后记录日志，并在停止前通过HTTP请求通知服务进行优雅关闭，确保数据一致性与连接平滑释放。

2.2 静态Pod与动态Pod的创建实践

静态Pod的定义与实现方式

静态Pod由kubelet直接管理，不经过API Server。其配置文件通常放置在特定目录（如 /etc/kubernetes/manifests），kubelet会周期性扫描并创建容器。

apiVersion: v1
kind: Pod
metadata:
  name: static-web
  namespace: default
spec:
  containers:
    - name: web
      image: nginx:alpine

该YAML文件放置于Node节点的清单目录后，kubelet自动创建Pod，并在本地生成一个关联的镜像Pod供API Server可见。

动态Pod的声明式管理

动态Pod通过kubectl或控制器提交至API Server，经调度器分配节点后由对应kubelet拉起。

支持副本控制、滚动更新等高级策略
生命周期受控制器（如Deployment）管理
可通过标签选择器进行服务绑定

两种模式适用于不同场景：静态Pod常用于系统组件自托管，动态Pod则广泛应用于业务部署。

2.3 多容器协同：Pod内容器通信与共享资源

在Kubernetes中，Pod是调度的最小单元，可包含多个紧耦合的容器。这些容器共享同一个网络命名空间、IPC和存储卷，从而实现高效的通信与数据共享。

共享存储卷

通过定义 volumeMounts，多个容器可挂载同一存储卷，实现文件级数据共享：

spec:
  volumes:
    - name: shared-data
      emptyDir: {}
  containers:
    - name: app-container
      image: nginx
      volumeMounts:
        - name: shared-data
          mountPath: /usr/share/nginx/html
    - name: sidecar-container
      image: busybox
      command: ["/bin/sh"]
      args: ["-c", "echo 'Hello' > /mnt/shared/index.html"]
      volumeMounts:
        - name: shared-data
          mountPath: /mnt/shared

上述配置中， emptyDir卷在Pod生命周期内持久存在，两个容器通过挂载同一卷实现文件共享。

网络通信机制

Pod内所有容器共享IP和端口空间，可通过 localhost直接通信。例如，一个容器运行Web服务，另一个容器可通过 curl http://localhost:8080调用其接口，无需NAT或额外代理。

2.4 Pod健康检查：探针（Liveness与Readiness）配置实战

在Kubernetes中，Pod的稳定性依赖于合理的健康检查机制。Liveness和Readiness探针是实现这一目标的核心手段。

Liveness探针：保障容器存活

Liveness探针用于判断容器是否处于运行状态，若探测失败，kubelet将重启该Pod。以下为HTTP请求方式的配置示例：

livenessProbe:
  httpGet:
    path: /health
    port: 8080
  initialDelaySeconds: 15
  periodSeconds: 10
  failureThreshold: 3

上述配置表示：容器启动后15秒开始探测，每10秒执行一次，连续3次失败则触发重启。`path`指向健康检查接口，需确保应用暴露对应路径。

Readiness探针：控制流量接入

Readiness探针决定Pod是否准备好接收流量。未通过探测时，Service会将其从端点列表中剔除。

探测方式支持HTTP、TCP、Exec命令
与Liveness不同，失败不会重启容器
适用于加载配置、数据库连接等初始化场景

2.5 调度约束：NodeSelector与Taints/Tolerations应用

在 Kubernetes 调度机制中，NodeSelector 和 Taints/Tolerations 提供了精细化的节点调度控制能力。

NodeSelector 基础用法

通过标签选择器将 Pod 调度到指定节点。需先为节点打标签：

kubectl label nodes node-1 disktype=ssd

随后在 Pod 配置中指定：

nodeSelector:
  disktype: ssd

该配置确保 Pod 仅运行在具有 disktype=ssd 标签的节点上。

Taints 与 Tolerations 协同控制

Taints 用于排斥 Pod，避免非授权工作负载进入节点：

kubectl taint nodes node-2 dedicated=gpu:NoSchedule

对应 Pod 必须配置容忍才能调度：

tolerations:
- key: "dedicated"
  operator: "Equal"
  value: "gpu"
  effect: "NoSchedule"

此机制常用于隔离 GPU 节点或系统组件专用节点，实现资源硬隔离。

第三章：Service——实现服务发现与负载均衡

3.1 Service工作原理与ClusterIP实现机制

Service 是 Kubernetes 实现服务发现与负载均衡的核心组件，其核心功能依赖于 kube-proxy 和 iptables/IPVS 规则协同工作。

Service 代理模式

kube-proxy 在每个节点运行，监听 API Server 中 Service 与 Endpoint 的变更事件，动态更新本地网络规则。当前主流模式为 IPVS 模式，具备更高的性能和连接调度效率。

ClusterIP 实现流程

当创建类型为 ClusterIP 的 Service 时，Kubernetes 分配一个虚拟 IP，该 IP 仅在集群内部可达。数据包通过以下流程转发：

Pod 发送请求至 Service 的虚拟 IP:Port
流量被 iptables 或 IPVS 规则拦截
根据负载均衡算法选择后端 Pod
通过 CNI 网络将流量转发至目标 Pod

apiVersion: v1
kind: Service
metadata:
  name: nginx-service
spec:
  type: ClusterIP
  selector:
    app: nginx
  ports:
    - protocol: TCP
      port: 80
      targetPort: 80

上述配置定义了一个 ClusterIP 类型的 Service，将集群内对 80 端口的请求负载均衡到带有 app=nginx 标签的 Pod。字段 port 表示 Service 暴露的端口， targetPort 指定 Pod 实际监听的端口。

3.2 NodePort与LoadBalancer类型Service部署实战

NodePort Service 部署示例

通过以下 YAML 定义创建一个 NodePort 类型的 Service，将集群内部服务暴露到节点主机的特定端口：

apiVersion: v1
kind: Service
metadata:
  name: my-nodeport-service
spec:
  type: NodePort
  selector:
    app: nginx
  ports:
    - protocol: TCP
      port: 80
      targetPort: 80
      nodePort: 30080

其中， nodePort 指定宿主机映射端口（范围默认 30000-32767），外部可通过 NodeIP:30080 访问服务。

LoadBalancer Service 实现原理

在云平台环境中，LoadBalancer 类型会自动创建外部负载均衡器，并将流量导向 NodePort 或直接 Pod。其核心依赖云厂商的控制器实现。

NodePort 是基础，LoadBalancer 建立在其之上
需云平台支持（如 AWS ELB、阿里云 SLB）
自动配置外部 IP 并绑定后端节点

3.3 Headless Service在有状态应用中的应用场景

在有状态应用如数据库集群、分布式缓存中，每个实例需保持独立身份与持久化存储。Headless Service通过直接暴露Pod的DNS记录，实现客户端对具体实例的精准访问。

服务发现机制

Kubernetes为每个Pod生成唯一DNS名称：`<pod-name>.<service-name>.<namespace>.svc.cluster.local`，便于节点间相互发现。

StatefulSet集成示例

apiVersion: v1
kind: Service
metadata:
  name: mysql-headless
spec:
  clusterIP: None  # 关键：定义为Headless Service
  selector:
    app: mysql
  ports:
    - protocol: TCP
      port: 3306

该配置禁用集群IP分配，使DNS直接返回Pod IP列表，适用于MySQL主从拓扑建立。

典型应用场景

Redis哨兵模式中实现节点自动发现
MongoDB副本集成员间通信
ZooKeeper集群选举协调

第四章：Deployment——声明式应用管理与运维

4.1 Deployment控制器原理与滚动更新策略

Deployment 是 Kubernetes 中用于管理无状态应用的核心控制器，通过声明式配置实现 Pod 的自动化部署、扩缩容与更新。

工作原理

Deployment 通过控制 ReplicaSet 来确保指定数量的 Pod 副本始终运行。每次更新 Deployment 的模板字段（如容器镜像），系统会创建新的 ReplicaSet 并逐步替换旧版本。

滚动更新策略

默认采用 RollingUpdate 策略，通过两个关键参数控制发布过程：

maxSurge：超出期望副本数的最大值，可为绝对数或百分比；
maxUnavailable：更新期间允许不可用的 Pod 最大数量。

strategy:
  type: RollingUpdate
  rollingUpdate:
    maxSurge: 25%
    maxUnavailable: 25%

上述配置表示在更新过程中，最多可额外创建 25% 的 Pod，同时最多允许 25% 的 Pod 不可用，确保服务连续性与发布效率之间的平衡。

4.2 使用YAML定义Deployment并部署实际应用

在Kubernetes中，Deployment是管理Pod副本和声明式更新的核心资源。通过YAML文件，可以清晰地定义应用的期望状态。

编写Deployment YAML

apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx-deployment
  labels:
    app: nginx
spec:
  replicas: 3
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
    spec:
      containers:
      - name: nginx
        image: nginx:1.21
        ports:
        - containerPort: 80

该配置定义了一个名为nginx-deployment的部署，维护3个Nginx Pod副本。`replicas`指定副本数，`selector`确保Deployment管理带有对应标签的Pod，`template`中定义了容器镜像和端口映射。

部署与验证

执行 kubectl apply -f deployment.yaml应用配置，随后使用 kubectl get pods查看Pod运行状态。Deployment控制器会自动确保Pod健康并维持所需副本数，支持滚动更新与版本回滚。

4.3 滚动更新与回滚操作实战演练

在 Kubernetes 部署中，滚动更新允许在不停机的情况下平滑升级应用版本。通过设置 Deployment 的 `strategy` 字段为 `RollingUpdate`，可控制更新过程中可用 Pod 数量。

配置滚动更新策略

strategy:
  type: RollingUpdate
  rollingUpdate:
    maxSurge: 1
    maxUnavailable: 0

上述配置确保更新期间至少维持原有副本数（maxUnavailable=0），并逐个新增新版本 Pod（maxSurge=1），实现零中断发布。

执行回滚操作

当新版本异常时，可通过命令快速回退：

kubectl rollout undo deployment/my-app --to-revision=2

该命令将部署回滚至指定历史版本（revision=2）。使用 kubectl rollout history deployment/my-app 可查看所有版本记录。

参数	说明
maxSurge	超出期望副本数的最大额外 Pod 数
maxUnavailable	更新期间允许不可用的 Pod 最大数量

4.4 扩缩容（Scaling）与自动伸缩（HPA）基础配置

在 Kubernetes 中，扩缩容分为手动和自动两种方式。手动扩缩容通过 kubectl scale 命令调整 Pod 副本数，适用于可预测的负载变化。

Horizontal Pod Autoscaler（HPA）工作原理

HPA 根据观测到的指标（如 CPU 利用率、内存或自定义指标）自动调整 Deployment 的副本数量。其核心控制器定期从 Metrics Server 获取数据，并计算所需副本数。

HPA 配置示例

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: nginx-hpa
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: nginx-deployment
  minReplicas: 2
  maxReplicas: 10
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        type: Utilization
        averageUtilization: 50

上述配置表示：当 CPU 平均利用率超过 50% 时，HPA 将自动增加副本，范围维持在 2 到 10 之间。scaleTargetRef 指定目标部署，metrics 定义扩缩容依据的指标。

关键参数说明

minReplicas：最小副本数，保障服务基础可用性；
maxReplicas：最大副本数，防止资源过度消耗；
averageUtilization：目标资源使用率，触发扩容阈值。

第五章：核心组件协同工作机制与学习建议

组件间通信模式解析

在微服务架构中，核心组件如API网关、服务注册中心与配置中心需高效协作。以Spring Cloud为例，服务启动时向Eureka注册实例信息，Config Server通过Git仓库加载配置，客户端通过总线刷新配置。


@RefreshScope
@RestController
public class ConfigController {
    @Value("${app.message}")
    private String message;

    @GetMapping("/info")
    public String getInfo() {
        return message;
    }
}