弹性的实证评估与探索性数据分析应用
1. 弹性的概念与背景
弹性指的是系统在经历变化或干扰后恢复到正常运行状态的能力。在现代计算机应用中,系统面临着各种环境变化,如不同的工作负载、用户间难以预测的交互以及不断变化的故障负载等,因此对弹性的需求日益增长。
与传统的可靠性不同,可靠性主要关注设计阶段预期的故障及其影响,而弹性系统需要在环境因素发生变化时仍能保持其性能。传统上,通过MTTF、MTBF或按需故障概率等定量指标来表征IT系统的可靠性,这些指标主要关注干扰的平均影响。但从发现和评估弹性特征的角度来看,这种方法可能不够充分或具有误导性,因为弹性分析更关注瞬态的时间特性和“最坏情况”场景。
目前,弹性量化仍是一个积极研究的领域,不同的研究从不同角度进行探索,如网络视角、基于状态的模型等。然而,现有的分析和统计建模方法在应对弹性评估时存在局限性,因为它们往往基于已知的机制,而未来的变化可能激活隐藏的机制,使模型失效。因此,需要一种新的系统表征方法来应对弹性设计的需求。
2. 探索性数据分析(EDA)
2.1 EDA的基本概念
现代统计学通常将数据分析分为探索性数据分析(EDA)和验证性数据分析(CDA)两种基本模式。EDA是一种成熟的统计传统,旨在通过观察数据发现模式,为假设的发展和完善提供概念和计算工具。它由美国数学家John Tukey开创,其核心是“观察数据”,以发现模式并构建合理的数据“故事”。而CDA主要处理正式的假设检验和模型选择。
在“Tukey学派”的EDA中,具有以下特点:
- 强调对数据的理解。
- 以图形表示作为“侦探工作”的主要驱动力,通过自适应地遍历
超级会员免费看
订阅专栏 解锁全文
35

被折叠的 条评论
为什么被折叠?



