系统容量规划:从数据处理到新服务上线
1. 数据处理与容量规划基础
在开始容量规划之前,我们需要收集和处理相关数据。传统的容量规划会查看逐年统计数据并基于这些数据进行预测,但在大规模、快速变化的环境中,我们需要对这种方法进行改进,以便能更快地应对需求变化。
在大规模环境下,一个目标是根据可测量的核心驱动因素简单而准确地确定所需资源。一种实现方法是根据一个机架或一组机器的服务能力,将指标简化为用户块。例如,一个应用可能每个机架可服务 10 万个活跃用户,另一个应用可能每个集群可服务 1000 个活跃用户,每个集群是一组作为独立单元的标准化机器组合。随着新的、更快的硬件出现或新的软件设计诞生,工程人员可以得出新的比率。这样,容量规划就变得更简单,资源也可以基于活跃用户块进行管理。虽然这种方法不够精细,但它与部署粒度相匹配,因为我们不能购买半台机器,所以容量规划不需要非常精确。
为了确定核心驱动因素与资源消耗之间的关系,我们首先要了解哪些核心驱动因素影响哪些资源以及影响的程度。方法是将资源使用指标与核心驱动因素指标进行关联。
1.1 相关性分析
相关性用于衡量数据源之间的相似程度。在监控图上,我们可能会看到服务器 CPU 使用率的增加与同一服务器的网络流量增加相匹配,同时也与每秒查询率(QPS)的峰值相匹配。从这些观察中,我们可以得出这三个测量值是相关的,但不一定能说一个的变化导致了另一个的变化。
回归分析从数学上计算时间序列数据源的匹配程度。对指标进行回归分析可以表明核心驱动因素的变化对主要资源使用的影响程度,也可以表明两个核心驱动因素之间的关联程度。
进行时间序列数据的回归分析时,首先要定义一个时间
超级会员免费看
订阅专栏 解锁全文
925

被折叠的 条评论
为什么被折叠?



