并行作业工作负载模拟:日志、模型与重采样的权衡
在系统设计的分析与评估中,利用记录的工作负载来驱动模拟是常见的做法。一般有两种主要方式:一是直接使用记录的数据进行模拟;二是从日志中创建模型,再用模型进行分析或模拟。然而,这两种方法都存在不足,而重采样的思路则试图结合两者的优势。
1. 工作负载建模
工作负载模型的生成通常遵循以下步骤:
1. 确定需建模的工作负载属性 :识别那些预计会影响结果的重要属性,如作业到达时间和资源需求。
2. 收集数据 :从生产系统中收集工作负载日志。
3. 拟合数据 :将确定的工作负载属性数据拟合到数学分布中。
生成的模型通过这些分布来描述工作负载,可用于生成随机变量作为模拟输入,或直接用于数学分析。与日志相比,工作负载模型具有诸多优势:
|优势|详情|
|----|----|
|全面了解工作负载特性|建模者能清楚知晓工作负载参数间的相关性,有助于加深理解并催生新设计;而日志可能包含未知且影响结果的特征,难以利用且易造成混淆。|
|便于参数调整|可逐个改变模型参数,研究其影响,能直接测量系统对不同参数的敏感度,还能轻松检查不同负载水平并选择匹配特定站点工作负载的参数。|
|不受特定策略和约束影响|日志记录可能受站点特定策略和约束影响,导致数据不能反映“自然”分布;而模型可重建假定的真实分布。|
|避免虚假数据干扰|日志可能包含因超出资源限制而被终止的作业记录,这些数据会影响系统负载和到达过程;模型可避免此类数据,也可按需显式建模。|
|统计特
超级会员免费看
订阅专栏 解锁全文
1163

被折叠的 条评论
为什么被折叠?



