共享云基础设施混合工作负载分析
在当今的云计算环境中,对混合工作负载的有效管理和优化是提高系统性能和资源利用率的关键。本文将深入探讨共享云基础设施中混合工作负载的特点、优化标准以及面临的问题,并介绍工作负载的格式化方式。
工作负载的用户导向视图
从用户角度分析工作负载,可以为我们提供不同的视角。通过2016年的堆叠图,我们可以看到云虚拟机(VM)和网格作业的每个用户分配的CPU核心数量。在云环境中,约15个用户的长时间运行工作负载消耗了大部分CPU核心;而在网格环境中,情况正好相反,大多数CPU核心被许多执行时间受限工作负载的不同用户消耗。这是因为每个网格作业都有严格的运行时间限制,再加上日常和每周的周期,使得网格工作负载的整体利用率曲线更加“嘈杂”。
维护周期
系统的维护周期对工作负载的运行有重要影响。我们通过系统管理员的计划升级/维修日志,重建了主要的系统升级和维护周期。在2016年,除了5月初因计划的硬盘固件升级导致28个节点(共416个CPU)关闭一周外,全年离线CPU的总数相当低(约占可用CPU的1.3%)。这次事件是唯一一次离线CPU总数超过500的情况,导致13.3%的基础设施在一周内无法使用。
系统使用的优化标准
在共享云基础设施上运行的云系统和网格系统有不同的优化目标。
网格优化标准
网格分区有四个主要的优化标准:
1. 最小化平均等待时间 :即作业在开始执行前等待的平均时间。
2. 最小化平均有界减速 :有界减速是作业实际响应时间与无等待执行时响应时间的比
超级会员免费看
订阅专栏 解锁全文
1009

被折叠的 条评论
为什么被折叠?



