k8s 探针

最新推荐文章于 2025-10-13 20:58:19 发布

原创最新推荐文章于 2025-10-13 20:58:19 发布 · 3.8k 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#kubernetes #docker #容器

kubernetes 专栏收录该内容

40 篇文章

订阅专栏

文章介绍了Kubernetes中的三种探针——存活探针、就绪探针和启动探针，它们分别用于检查容器运行、响应请求及应用程序启动情况。当探针检查失败时，系统会采取相应措施，如重启容器或停止流量调度。文章还通过示例yaml配置展示了如何设置这三种探针，并解释了其在实际操作中的影响。

1.前言

Kubernetes探针(Probe)是用于检查容器运行状况的一种机制。探针可以检查容器是否正在运行，容器是否能够正常响应请求，以及容器内部的应用程序是否正常运行等。在Kubernetes中，探针可以用于确定容器的健康状态，如果容器的健康状态异常，Kubernetes将会采取相应的措施，例如重启容器或将其从服务中删除

2.探针类型

k8s有三种类型的探针分别是Liveness Probe(存活探针)、Readiness Probe(就绪探针)、Startup Probe(启动探针)

Liveness Probe：用于检查容器是否正在运行，如果Liveness Probe检查失败，则Kubernetes将重启容器

Readiness Probe：用于检查容器是否能够正常响应请求，如果Readiness Probe检查失败，则Kubernetes将停止将流量发送到该容器

Startup Probe：用于检查容器内部的应用程序是否已经启动并且已经准备好接受流量，如果Startup Probe检查失败，则Kubernetes将重启容器

总的来说存活探针、启动探针在检测容器的探针失败时重启容器，就绪探针在检测容器的探针失败时禁止将流量调度到该容器，一般都是将就绪探针和存活探针一起使用，启动探针只在启动较慢的容器中结合使用，避免因为容器启动时间较长导致存活探针检测容器以为是不存活而一直重启容器，但是也可以将存活探针的检测时间设置长一点来解决此问题

3.探针的检测流程

同时使用三种探针的情况下

启动探针检测：在容器启动时，Kubernetes 将首先执行启动探针。如果启动探针失败，则 Kubernetes 将重启容器。启动探针只会在容器启动时执行一次

定期检测存活探针：存活探针用于检测容器是否处于运行状态。Kubernetes 将定期执行存活探针来确保容器仍然处于运行状态。如果探针失败，则 Kubernetes 将重启容器

定期检测就绪探针：就绪探针用于检测容器是否已准备好接收流量。Kubernetes 将定期执行就绪探针来确保容器已准备好接收流量。如果探针失败，则 Kubernetes 将从服务的端点中删除该容器，直到探针再次成功

4.探针的使用

4.1启动探针

编辑yaml文件

vi deployment-nginx.yaml

apiVersion: apps/v1
kind: Deployment
metadata: 
  labels:
    app: nginx
  name: nginx
  namespace: default
spec:
  replicas: 5
  progressDeadlineSeconds: 600
  minReadySeconds: 10
  strategy:
    rollingUpdate:
      maxSurge: 1
      maxUnavailable: 0
    type: RollingUpdate
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
    spec: 
      containers:
      - name: nginx
        image: nginx:1.21
        imagePullPolicy: IfNotPresent
        ports:
        - containerPort: 80
        startupProbe:
          httpGet:
            path: /
            port: 81
            scheme: HTTP
          initialDelaySeconds: 20
          timeoutSeconds: 5
          successThreshold: 1
          failureThreshold: 3
          periodSeconds: 10
---
apiVersion: v1
kind: Service
metadata:
  name: nginx
  namespace: default
spec:
  selector:
    app: nginx
#  type: NodePort
  type: ClusterIP 
  clusterIP:
#  sessionAffinity: ClientIP
  ports:
    - port: 80
      targetPort: 80
#      nodePort: 30001
      protocol: TCP

该yaml的启动探针配置检测一个不存在服务的端口来检测启动探针的效果，执行yaml看看效果

kubectl create -f deployment-nginx.yaml

kubectl get pod

可以看到因为配置的启动探针探测失败的原因pod一直处于重启的状态，而且也是未准备的状态，未准备的状态，集群是不会调度流量到这些pod上面的

kubectl get svc

curl 10.98.231.214

也可以通过查看pod的详细信息查看状态

4.2就绪探针

编辑yaml文件

vi deployment-nginx.yaml

apiVersion: apps/v1
kind: Deployment
metadata: 
  labels:
    app: nginx
  name: nginx
  namespace: default
spec:
  replicas: 5
  progressDeadlineSeconds: 600
  minReadySeconds: 10
  strategy:
    rollingUpdate:
      maxSurge: 1
      maxUnavailable: 0
    type: RollingUpdate
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
    spec: 
      containers:
      - name: nginx
        image: nginx:1.21
        imagePullPolicy: IfNotPresent
        ports:
        - containerPort: 80
        readinessProbe:
          httpGet:   #配置探测的http信息
            path: /
            port: 81
            scheme: HTTP     
          initialDelaySeconds: 2  #首次发出探测请求的延迟时间，即多少秒后才开始探测
          periodSeconds: 5    #探测频率，默认为10秒
          timeoutSeconds: 5   #探测超时时间，默认为1秒
          successThreshold: 1  #处于失败状态时，需要探测成功多少次才算成功
          failureThreshold: 5   #处于成功状态时，需要探测失败多少次才算失败，默认为3

该yaml的就绪探针配置检测一个不存在服务的端口来检测就绪探针的效果，执行yaml看看效果

kubectl get pod

可以看到因为配置的就绪探针探测失败的原因，虽然pod状态是running，但是pod都是未准备的，接下来访问一下pod服务看看

kubectl get svc

curl 10.100.21.201

可以看到是拒绝连接的，所以因为就绪探针的原因，是没有流量调度到这些pod上的

也可以通过describe命令去查看pod的详细信息

4.3存活探针

编辑yaml文件

vi deployment-nginx.yaml

apiVersion: apps/v1
kind: Deployment
metadata: 
  labels:
    app: nginx
  name: nginx
  namespace: default
spec:
  replicas: 5
  progressDeadlineSeconds: 600
  minReadySeconds: 10
  strategy:
    rollingUpdate:
      maxSurge: 1
      maxUnavailable: 0
    type: RollingUpdate
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
    spec: 
      containers:
      - name: nginx
        image: nginx:1.21
        imagePullPolicy: IfNotPresent
        ports:
        - containerPort: 80
        livenessProbe:
          httpGet:
            path: /
            port: 81
            scheme: HTTP
          initialDelaySeconds: 30  #首次发出探测请求的延迟时间，即多少秒后才开始探测，可以根据自己的项目适当调大存活探针的首次探测时间，以免服务需要启动得时间较长，导致服务还没启动就被判定检测失败
          periodSeconds: 3          #探测频率，默认为10秒
          successThreshold: 1    #处于失败状态时，需要探测成功多少次才算成功
          timeoutSeconds: 2        #探测超时时间，默认为1秒
          failureThreshold: 3    #处于成功状态时，需要探测失败多少次才算失败，默认为3
---
apiVersion: v1
kind: Service
metadata:
  name: nginx
  namespace: default
spec:
  selector:
    app: nginx
#  type: NodePort
  type: ClusterIP 
  clusterIP:
#  sessionAffinity: ClientIP
  ports:
    - port: 80
      targetPort: 80
#      nodePort: 30001
      protocol: TCP

该yaml的存活探针配置检测一个不存在服务的端口来检测存活探针的效果，执行yaml看看效果

kubectl create -f deployment-nginx.yaml

kubectl get pod