带反馈的重采样:优化工作负载模拟的新方法
在计算机系统的性能评估和模拟中,使用日志来重现工作负载是一种常见的方法。然而,传统的日志驱动模拟存在一些问题,因为日志记录的是特定时刻的独特条件,可能不适用于所需的评估。为了解决这些问题,重采样和反馈机制应运而生。
重采样的起源:输入抖动和基于用户的建模
重采样的概念源于输入抖动和基于用户的建模。
输入抖动是日志在模拟中的一种创新应用。其核心思想是对作业流进行微小调整,即保持工作负载与日志基本一致,但对部分作业进行小幅度修改,例如随机改变作业的到达时间。这样可以进行多个相似但不完全相同的工作负载模拟,有助于识别原始结果是否因某些人为因素而不具有代表性。
基于用户的建模则基于多用户系统的工作负载由多个用户的工作负载组成这一观察。其方法是先为不同用户创建独立的工作负载,然后将它们组合起来。该方法最初是为了生成采样局部性而提出的。由于活跃用户群体随时间变化,短期内工作负载会有相似作业的重复,具有更强的局部性和可预测性;但长期来看,随着活跃用户的变化,工作负载也会改变。
基于用户的建模通过多层次模型来捕捉这种结构:
- 顶层是用户群体模型,包括新用户的到来和老用户的离开。
- 第二层将单个用户的活动建模为与一天中的时间同步的会话序列。
- 底层是每个会话内作业的重复。
这种建模方法在解决上述问题上取得了显著进展:
- 不同用户的作业模型不同,工作负载自然具有局部性。
- 可以通过改变活跃用户数量或用户群体模型的参数来调整系统负载。
- 能够生成包含非平稳元素(如每日周期)的工作负载。
- 可以根据需要包含或排除独特事件
超级会员免费看
订阅专栏 解锁全文
2273

被折叠的 条评论
为什么被折叠?



