Kubernetes API 流量控制机制深度解析-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00538/article/details/148523813

Kubernetes API 流量控制机制深度解析

website Kubernetes website and documentation repo: 项目地址: https://gitcode.com/gh_mirrors/webs/website

概述

在 Kubernetes 集群中，API 服务器作为核心组件，负责处理所有集群操作请求。当集群负载较高时，如何公平合理地分配 API 服务器的处理能力就变得尤为重要。Kubernetes 提供的 API 优先级和公平性（API Priority and Fairness，简称 APF）机制正是为了解决这一问题。

APF 核心概念

APF 机制通过两个关键资源对象来管理 API 请求：

优先级级别（PriorityLevelConfiguration）：定义了不同请求的优先级和处理配额
流模式（FlowSchema）：将特定特征的请求分类到对应的优先级级别

这种机制确保了高优先级请求（如系统关键操作）能够获得足够的资源，同时防止低优先级请求（如批量作业）过度占用 API 服务器资源。

诊断工具

响应头信息

启用 APF 功能后，每个 API 响应都会包含两个特殊头信息：

X-Kubernetes-PF-FlowSchema-UID：匹配请求的流模式 UID
X-Kubernetes-PF-PriorityLevel-UID：分配到的优先级级别 UID

由于安全考虑，这些头信息只包含 UID 而不包含名称。如需查看 UID 与名称的对应关系，可以使用以下命令：

# 查看流模式 UID 与名称映射
kubectl get flowschemas -o custom-columns="uid:{metadata.uid},name:{metadata.name}"

# 查看优先级级别 UID 与名称映射
kubectl get prioritylevelconfigurations -o custom-columns="uid:{metadata.uid},name:{metadata.name}"

调试端点

APF 提供了多个调试端点，需要确保有相应访问权限：

优先级级别状态查看：
```
kubectl get --raw /debug/api_priority_and_fairness/dump_priority_levels
```
输出为 CSV 格式，包含各优先级级别的活动队列数、空闲状态、等待请求数等关键指标。
队列状态查看：
```
kubectl get --raw /debug/api_priority_and_fairness/dump_queues
```
输出显示各队列的待处理请求数、执行中请求数、座位使用情况等详细信息。
请求详情查看：
```
kubectl get --raw /debug/api_priority_and_fairness/dump_requests
```
基本版本显示请求的优先级、流模式、队列索引等基本信息。

如需更详细信息（包括用户、操作类型等）：
```
kubectl get --raw '/debug/api_priority_and_fairness/dump_requests?includeRequestDetails=1'
```