Knative Serving:ABP 应用的 scale-to-zero 与并发模型 🚀
📚 目录
0. TL;DR 🧾
- 选择 KPA(Knative Pod Autoscaler)按 并发/RPS 伸缩,原生支持 scale-to-zero(全局开关);HPA 仅支持 CPU/内存,不支持 归零。
- Activator 在 0→1 或 突发超过 TBC(Target Burst Capacity,默认 200) 时入链缓冲并触发扩容;queue-proxy 在每个 Pod 前实施 硬并发(
containerConcurrency)与排队并导出指标(仅当 硬并发>1 才会导出revision_queue_depth)。 - 冷启动治理:
initial-scale(修订创建预热)+activation-scale(from-zero 预热)+scale-down-delay(延迟降容)+stable-window(默认 60s)组合拳。 - 路由/灰度:Serving 原生 按修订百分比;按路径灰度 交给 Ingress/Gateway(Istio/Kong/Contour…)实现。

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



