Kubernetes HorizontalPodAutoscaler 实践指南-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00273/article/details/148525067

Kubernetes HorizontalPodAutoscaler 实践指南

website Kubernetes website and documentation repo: 项目地址: https://gitcode.com/gh_mirrors/webs/website

概述

HorizontalPodAutoscaler（简称HPA）是Kubernetes中一个强大的自动扩缩容工具，它能够根据工作负载的实际需求自动调整Pod数量。本文将带您深入了解HPA的工作原理，并通过一个完整的实践示例展示如何使用HPA自动管理Web应用的规模。

核心概念

水平扩展 vs 垂直扩展

水平扩展：通过增加或减少Pod数量来应对负载变化
垂直扩展：通过调整单个Pod的资源配额（如CPU、内存）来应对负载变化

Kubernetes的HPA实现的是水平扩展策略，这种方式更符合云原生应用的弹性需求。

实践准备

在开始前，请确保您的Kubernetes集群满足以下条件：

集群版本不低于1.23
已安装并配置Metrics Server组件
具备足够的计算资源用于示例部署

示例应用部署

我们将使用一个运行PHP代码的Apache httpd服务器作为示例应用。首先创建部署和服务：

apiVersion: apps/v1
kind: Deployment
metadata:
  name: php-apache
spec:
  selector:
    matchLabels:
      run: php-apache
  replicas: 1
  template:
    metadata:
      labels:
        run: php-apache
    spec:
      containers:
      - name: php-apache
        image: registry.k8s.io/hpa-example
        ports:
        - containerPort: 80
        resources:
          requests:
            cpu: 200m
---
apiVersion: v1
kind: Service
metadata:
  name: php-apache
  labels:
    run: php-apache
spec:
  ports:
  - port: 80
  selector:
    run: php-apache

应用此配置：

kubectl apply -f php-apache.yaml

创建HorizontalPodAutoscaler

接下来，我们创建一个HPA对象，它将自动管理php-apache部署的副本数量：

kubectl autoscale deployment php-apache --cpu-percent=50 --min=1 --max=10

这个命令创建了一个HPA，它会：

监控php-apache部署的CPU使用率
目标是将平均CPU使用率维持在50%
最小保持1个副本
最大扩展到10个副本

工作原理详解

HPA控制器会定期（默认30秒）检查指标数据，并根据以下算法计算期望的副本数：

期望副本数 = ceil[当前副本数 * (当前指标值 / 目标指标值)]

在我们的例子中：

每个Pod请求200m CPU
目标使用率50%即100m CPU
当实际使用率达到200m时，HPA会将副本数翻倍

负载测试

为了观察HPA的实际效果，我们创建一个负载生成器：

kubectl run load-generator --image=busybox -- /bin/sh -c "while sleep 0.01; do wget -q -O- http://php-apache; done"

观察HPA的变化：

kubectl get hpa php-apache --watch

您将看到类似输出：

NAME         REFERENCE               TARGET   MINPODS  MAXPODS  REPLICAS  AGE
php-apache   Deployment/php-apache   250%/50% 1        10       5         5m

这表明当前CPU使用率为250%，HPA已将副本数调整为5个。

高级配置

多指标自动扩缩容

HPA支持基于多种指标进行扩缩容决策。我们可以通过编辑HPA定义来添加更多指标：

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: php-apache
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: php-apache
  minReplicas: 1
  maxReplicas: 10
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        type: Utilization
        averageUtilization: 50
  - type: Pods
    pods:
      metric:
        name: packets-per-second
      target:
        type: AverageValue
        averageValue: 1k
  - type: Object
    object:
      metric:
        name: requests-per-second
      describedObject:
        apiVersion: networking.k8s.io/v1
        kind: Ingress
        name: main-route
      target:
        type: Value
        value: 10k