可观测的数据数据指标
- 服务应用:CPU利用率、内存、ygc次数
- 接口:核心关注接口的请求响应时间(平均响应时间、P90、P95,核心关注后面2个)、慢请求情况
- 数据库:主要关注CPU使用率、内存使用率
- Redis:主要关注CPU使用率、内存使用率、最大负载、网络使用情况
- ES:主要关注CPU使用率、内存使用率、最大负载、网络情况、磁盘使用率
量化数据
- 量化QPS和耗时的关系
- 量化QPS和系统资源的关系



压测目标
- 探查线上资源配置下,达到线上峰值QPS max 3倍时的资源使用情况以及过程的性能瓶颈
- 探查线上资源配置下的最高负载(最佳QPS max)
- 单个pod资源配置下可支撑的最高(最佳)QPS max(与线上qps成等比关系)
常见异常
参考资料:CPU、Load、内存及网络等系统指标异常的排查_GeorgiaStar的博客-优快云博客_如何排查cpu、内存、网络io问题
文章关注服务应用的CPU和内存使用,接口响应时间,特别是P90和P95,以及数据库、Redis和ES的资源状况。通过量化QPS和耗时、系统资源的关系,进行压测以确定线上配置下的性能瓶颈和最高负载能力。同时,文章也涉及了系统异常排查的参考资源。
2270

被折叠的 条评论
为什么被折叠?



