应用弹性容量管理与软件升级策略解析
1. 应用过载与弹性增长考虑
在应用运行过程中,过载情况可能会带来一系列问题。过载时,代码执行方式可能不同,增加了暴露错误代码中残留缺陷的风险。例如,应用架构师需确保在过载期间,弹性增长相关操作不被拥塞控制机制拒绝,防止出现增长死锁,即在线应用容量不足,请求被阻塞,且由于过载控制拒绝关键操作,导致在线容量增长操作无法成功完成。
过载通常还会伴随性能下降,延迟完成时间,使应用变得迟缓,可能降低应用的供应间隔。此外,过载条件可能触发虚拟机(VM)故障或受损,此时应采用应用服务恢复(如故障转移到另一个 VM 实例)或修复(如终止故障 VM 实例并在另一台服务器上启动新的 VM 实例)技术。而且,弹性增长操作本身会给某些应用服务器组件带来额外负载,可能加剧过载情况。
弹性增长操作可能由以下原因触发:
- 应用服务性能因工作负载密度过高而下降,需增加在线容量以降低密度。
- 在线备用容量不足,可提前增加在线容量以应对日常工作负载增长和意外流量高峰。
- 工程容量超过策略阈值,当在线用户数量达到一定限制时,弹性增长新的资源实例以避免超过策略限制。
- 关键故障事件导致在线容量减少,执行容量增长操作以替换丢失的服务或备用容量。
通常,OSS 会主动监控提供的负载、历史流量模式、应用性能等因素,对提供的负载进行短期预测。如果在线应用容量不足以满足预测的工作负载,且无法维持足够的“备用”在线容量以应对故障和临时工作负载事件,OSS 将启动弹性增长操作。其流程如下:
graph LR
A[监控提供的负载和资源使用情
超级会员免费看
订阅专栏 解锁全文
1217

被折叠的 条评论
为什么被折叠?



