云容量管理:概念、趋势与规划模板
在当今数字化时代,云服务的应用日益广泛,云容量管理成为了确保服务高效运行和资源合理利用的关键。本文将深入探讨云容量管理的相关概念、新兴趋势以及提供一个实用的容量计划模板。
1. 容量管理基础概念
1.1 阈值管理
服务水平违规和性能下降主要通过监控工具集来检测,这些工具使用的服务违规限制即阈值。阈值为后续的警报和通知操作提供指导,其监控工具发出的警报可根据严重性和影响进行分类。
设置阈值时需格外谨慎,因为许多阈值依赖于特定组件上执行的任务。合理管理阈值对于以期望的性能和服务水平交付服务至关重要,适当的阈值设置能确保在服务违规发生或即将发生时生成的警报和通知有效,有助于采取补救措施以维持服务连续性和约定的服务水平。
如今,有一些工具集能够智能地确定阈值违规的概率,利用行为分析建立阈值违规模式并自动设置新的阈值限制,还能诊断监控工具产生的误报。
另外,有时需要优化动态云环境,如在混合云环境中进行工作负载移动以维持或提高性能和吞吐量。这可通过DRS、vMotion等工作负载管理工具和技术实现,但由于工作负载和底层基础设施的动态性质,这种移动会对自动阈值管理产生影响。
1.2 新兴趋势
- 自学习能力 :启发式和行为分析在IT安全领域已应用多年,实时行为分析在数据中心也能实现自学习异常检测。性能管理应实时分析行为,快速将基础设施性能与应用性能相互关联,而非试图对不断变化的性能变量进行建模。
- 自动化阈值管理 :作为自学习能力的一部分,阈值应具有适应性。虚拟环境的性能管理工具应能够学习并为服务器、虚拟机和应用程序建立行为配置文件,同时根据行为变化调整阈值。
- 对单个虚拟机和系统行为的可见性 :虚拟基础设施的组成部分众多,很难找出应用性能问题的根源。因此,了解每个虚拟机的健康状况和整个系统的健康状况至关重要,同时拥有多个上下文信息,如虚拟机相对于其主机管理程序服务器以及整个资源池的相对性能也很重要。
目前,有专门的现代容量管理解决方案提供商,提供自学习分析用于性能和容量管理。这些解决方案可跨离散云环境提供端到端可见性、自动问题诊断和预测分析。
- 主动容量规划 :性能管理工具应在部署前和生产中提供资源分配和容量规划。虚拟化的价值在于灵活性和资源优化,能够从一开始就实现这种优化的工具最为宝贵。
- 收益管理 :“以合适的价格向合适的客户销售合适的容量”,收益管理并非最新的容量规划和定价技术,最初由航空、火车和巴士服务提供商采用以实现利润最大化,其原则基于超额购买、定价和容量分配。
在运行基础设施即服务(IaaS)云时,最大的挑战之一是如何在性能交付和成本效益之间取得平衡,关键指标是云中的硬件利用率。收益管理能很好地解决云提供商如何提供性能和价值的问题。
云服务提供商可利用收益管理来决定如何最大限度地利用资源并确保物有所值,例如根据不同类型的客户需求和灵活的定价模型分配不同类型的虚拟机。其在云容量管理中可实现多个目标,如下表所示:
|目标|描述|
| ---- | ---- |
|提高预测虚拟资源需求和有效分配容量的能力|准确预估需求,合理分配资源|
|最大化虚拟资源的容量利用率|充分利用资源,避免浪费|
|优化定价以最大化收入和管理需求|根据市场情况和资源状况制定合理价格|
|管理客户对服务水平和资源性能的期望|让客户对服务有合理预期|
|建立价格和性能之间的权衡|在保证性能的前提下控制成本|
目前,云容量的销售模式主要有以下两种:
-
长期合同
:客户购买固定长期期限的容量,由于业务有保障且客户在固定合同期内有持续需求,会提供按需定价的折扣,类似于长期流行的托管模式。
-
按需计算
:客户通常按小时计费,但云供应商可能会面临需求的巨大波动。云供应商可采用收益优化技术,通过通知机制公布根据容量可用性调整后的当前定价,利用供需机制实现云容量的最佳收益。这类似于现货定价模型,但客户在被出价更高的对手击败时可能会失去实例。同时,还需考虑容量过度配置的决策,要考虑各种用户、客户和主机的使用趋势。
这些概念可形成一个多云市场,买卖双方对容量进行投标或反向投标,云计算中的反向投标机制能让用户以低价获得容量,同时为云提供商带来最大收益。
1.3 VM蔓延管理
实施私有云使开发、测试资源和应用程序部署资源更容易订购虚拟机,但一段时间后,企业会发现虚拟机四处蔓延,即使未使用也会消耗处理能力和存储。VM蔓延是简单快速的配置过程带来的不良副作用,可能成为一个大问题,抵消实施私有云的好处。
解决VM蔓延问题可采取以下措施:
1. 组织层面提高对虚拟机和云基础设施使用的认识并提供培训资源。
2. 生成容量报告,标记过度使用、使用不足和未使用的机器,并规定在一定时间后自动启动回收未使用机器的流程。
3. 实施收费机制,确保使用云基础设施的部门承担成本,促使用户交出未使用的虚拟机。
2. 容量计划模板
一个容量计划用于管理交付IT服务所需的资源,包含不同业务需求预测的场景和实现约定服务水平目标的成本选项。它能帮助制定评估和管理基础设施组件性能的策略,为容量规划决策提供便利,这些决策可能包括额外的基础设施采购、配置更改和升级决策,以有效满足业务需求。
2.1 文档控制
在容量计划中,需要建立一个有效的文档控制体系。随着计划的推进,计划所处的阶段和文档都会发生变化,常见的文档状态阶段如下:
-
草稿
:供审查的文档,可能会有重大更改。
-
工作基线
:文档已完成初始审查阶段,可作为技术设计的基础,但预计还会有进一步更改,会跟踪自上次草稿以来的更改。
-
基线候选
:文档准备好最终发布,预计只有进一步的小更新。
-
基线
:文档已发布,预计不会更改,会跟踪自工作基线以来的更改。
2.2 容量计划各部分内容
- 执行摘要 :容量计划中很多技术细节并非所有读者都感兴趣,执行摘要应突出主要问题、选项、建议和成本,包含主计划各部分的要点。其主要目标是促使在正确的领域做出投资决策,避免或推迟不适当的投资决策。应直接切入要解决的主要业务问题和所需决策,避免不必要的技术细节,说明对业务影响最大的问题、成本选项和合理的建议。由于整体容量和性能计划可能包含许多推荐投资和复杂的财务分析,执行摘要可单独成文档,针对特定的财务和基于业务的读者群体。
-
引言
:容量计划的目标是通过将组织资源和服务与业务需求相匹配,实现最佳且经济高效的配置。它反映了业务的当前和未来需求,有助于识别和减少资源利用不足或客户需求未满足带来的低效问题,以经济高效的方式提供满意的服务水平。此部分应包含以下摘要信息:
- 计划的时间范围(年度、半年或滚动月度计划)
- 计划范围内的组件、服务、设施、资源和技能
- 当前的容量水平
- 当前交付的性能,包括服务水平成就和记录的性能事件信息
- 因容量不足导致的事件摘要
- 对因容量过剩或不足预计何时会出现服务事件或财务影响的看法
- 自上次发布计划以来基础设施、业务环境、计划和预测的变化
-
计划的范围和职权范围
:该部分应考虑目标、目的和可交付成果,以及人员、流程、工具和技术等更广泛的问题,涵盖所有IT资源。例如,容量计划应涵盖以下详细内容:
- 业务容量管理(将业务需求和计划转化为服务和IT基础设施的需求)
- 服务容量管理(管理、控制和预测实时运营IT服务使用和工作负载的端到端性能和容量)
- 组件容量管理(管理、控制和预测单个IT技术组件的性能、利用率和容量)
此部分应明确说明上述内容中包含和排除的元素。
下面是一个简单的mermaid流程图,展示了容量计划的大致流程:
graph LR
A[开始] --> B[文档控制]
B --> C[执行摘要]
C --> D[引言]
D --> E[范围和职权范围]
E --> F[方法使用]
F --> G[应用]
G --> H[基础设施]
H --> I[用户任务场景]
I --> J[任务负载矩阵]
J --> K[监测和指标]
K --> L[服务需求和预测]
L --> M[服务层级]
M --> N[第三方]
N --> O[用户配置文件]
O --> P[使用场景]
P --> Q[结束]
以上就是云容量管理的相关概念、趋势以及容量计划模板的介绍,希望能为相关从业者提供有价值的参考。
云容量管理:概念、趋势与规划模板
2.3 方法使用
容量管理高度依赖其他流程提供的信息。此部分应说明信息来源、用于收集和分析信息的工具,以及用于模拟对基础设施和服务性能影响的方法。这可能包括来自基础设施组件的监控数据、应用程序性能工具、业务预测(包括宏观经济影响)、工作负载预测、建模技术以及服务建模工具的输出。
具体来说,应包含现有监控工具通常生成的性能、可用性和服务级别数据,这些工具用于调查基础设施组件和应用程序执行情况,生成详细的工作负载预测和最终用户交付统计信息。更成熟的组织还会包括业务预测(包括宏观经济影响)、使用的建模技术以及服务建模工具的输出。
2.4 应用
这部分必须包含有关组织每个应用程序的数据并进行记录,同时要确保所有应用程序都被考虑到,并且每个应用程序的信息准确无误。具体操作步骤如下:
1. 组建专门的数据收集团队,负责收集应用程序的相关信息。
2. 制定详细的数据收集清单,包括应用程序的名称、功能、使用频率、性能指标等。
3. 定期对收集到的数据进行审核和更新,确保数据的准确性和及时性。
2.5 基础设施
该部分包括有关数据中心虚拟和物理资产的数据,并在工作簿中进行记录。所有设备都要被统计,且每个设备的信息必须正确。此部分将预测的服务需求转化为基础设施资源(如处理器、内存、存储、许可证、网络、数据中心和电力)的利用率,最佳做法是使用服务容量模型进行这些计算。
收集编写此部分所需的数据需要与基础设施和监控技术人员密切合作,各技术团队之间的紧密合作通常能带来如何更好地利用现有投资以获取更好数据和性能的见解。
这部分应展示所有基础设施领域的近期利用率,并至少提前12个月预测资源需求,突出显示基础设施限制可能导致性能事件或中断的任何关键日期。选项和建议部分应包含避免负面业务影响的建议。具体操作步骤如下:
1. 与基础设施和监控技术人员建立沟通机制,定期召开会议,分享数据和见解。
2. 利用专业的监控工具,实时收集基础设施资源的使用情况。
3. 根据收集到的数据,使用服务容量模型进行资源需求预测。
4. 针对预测结果,制定相应的资源调整策略,如增加或减少资源配置。
2.6 用户任务场景
使用场景(也称为用例)定义了用户执行的任务序列以及他们与解决方案功能的交互,以帮助他们完成任务。容量计划的这部分应定义用户在各自功能领域中处理的场景,识别和描述使用场景可提供有助于估计容量负载和其他因素的详细信息。具体操作步骤如下:
1. 对用户进行分类,例如按部门、角色等。
2. 与不同类型的用户进行沟通,了解他们的工作流程和需求。
3. 根据用户的反馈,定义具体的使用场景,并进行详细描述。
2.7 任务负载矩阵
任务负载矩阵描述了每个使用场景对系统施加的不同类型的负载,该矩阵会根据容量规划场景对服务器和客户端配置进行适当测量。以下是一个简单的任务负载矩阵示例:
|使用场景|服务器负载|客户端负载|
| ---- | ---- | ---- |
|场景1|高|低|
|场景2|中|中|
|场景3|低|高|
2.8 监测和指标
监测和指标部分描述了用于评估解决方案和组件性能的监测方法、技术和工具,并为规划干预提供指标。此信息应针对解决方案级别的每个主要组件提供。具体操作步骤如下:
1. 选择合适的监测工具,如性能监测软件、日志分析工具等。
2. 确定需要监测的关键指标,如响应时间、吞吐量、资源利用率等。
3. 制定监测计划,包括监测频率、数据收集方式等。
4. 对监测数据进行分析,及时发现性能问题并采取相应的措施。
2.9 服务需求和预测
业务计划应向容量管理提供有关新服务计划以及现有服务使用增长或收缩的详细信息。此子部分应报告新服务和遗留系统的淘汰情况,以服务经理和业务领导者熟悉的术语(如服务交易峰值、平均值和总数、处理的账户数量等)描述提供的IT服务。
应针对新服务和现有服务提供配置文件和预测,包括任何服务退役计划。基于业务计划、促销和活动时间表提供的最佳信息,应包括短期、中期和长期预测。关键和高影响的业务服务应单独进行配置文件分析,不太关键的服务可以汇总分析,前提是仍能估计资源需求。具体操作步骤如下:
1. 收集业务计划中的相关信息,包括新服务计划、市场趋势等。
2. 分析现有服务的使用数据,了解服务的增长或收缩情况。
3. 根据收集到的信息,使用合适的预测模型进行服务需求预测。
4. 定期对预测结果进行评估和调整,确保预测的准确性。
2.10 服务层级
这些层级用于确保基于预先确定的应用程序关键标准设置适当的服务层级,如黄金级、青铜级和白银级。不同服务层级的特点如下表所示:
|服务层级|特点|
| ---- | ---- |
|黄金级|提供最高级别的服务保障,如低延迟、高可用性等|
|白银级|服务保障水平适中,能满足大多数用户的需求|
|青铜级|服务保障水平相对较低,价格也较为实惠|
2.11 第三方
这部分收集来自供应商和内部联系人的所有联系信息,以便所有利益相关者都能随时获取。容量计划起草完成后,应以明确且易于访问的格式在所有利益相关者之间分发,呈现组件、服务和业务视图,以便在持续的容量管理中实施。具体操作步骤如下:
1. 建立第三方联系人信息数据库,包括供应商、合作伙伴等。
2. 定期更新数据库中的信息,确保信息的准确性。
3. 在容量计划中明确列出第三方联系人信息,并提供访问方式。
2.12 用户配置文件
用户配置文件描述了提议解决方案的用户以及某些重要的用户特征,如解决方案使用频率和使用解决方案的能力。用户可以按组(或类别)识别,通常根据其功能领域来表述。信息技术用户包括帮助台、数据库管理等,业务用户包括会计、仓储、采购等。描述用户及其重要特征有助于形成与容量相关的场景。具体操作步骤如下:
1. 设计用户调查问卷,了解用户的基本信息、使用习惯等。
2. 对调查结果进行分析,将用户进行分类。
3. 为不同类型的用户建立用户配置文件,包括用户特征、需求等。
2.13 使用场景
使用场景(也称为用例)定义了用户执行的任务序列以及他们与解决方案功能的交互,以帮助他们完成任务。这部分应定义用户在每个功能领域中执行的场景,识别和描述使用场景可提供有助于估计容量负载和其他因素的详细信息。具体操作步骤与前面提到的用户任务场景部分类似,在此不再赘述。
通过以上对云容量管理概念、趋势以及容量计划模板的详细介绍,我们可以看到,有效的云容量管理对于企业的发展至关重要。合理运用各种管理方法和技术,制定科学的容量计划,能够帮助企业提高资源利用率,降低成本,提升服务质量,从而在激烈的市场竞争中取得优势。
下面是一个mermaid流程图,展示了云容量管理的整体流程:
graph LR
A[容量管理基础概念] --> B[阈值管理]
A --> C[新兴趋势]
A --> D[VM蔓延管理]
B --> E[设置阈值]
B --> F[优化云环境]
C --> G[自学习能力]
C --> H[自动化阈值管理]
C --> I[可见性管理]
C --> J[主动容量规划]
C --> K[收益管理]
D --> L[组织培训]
D --> M[生成报告]
D --> N[实施收费]
E --> O[容量计划模板]
F --> O
G --> O
H --> O
I --> O
J --> O
K --> O
L --> O
M --> O
N --> O
O --> P[文档控制]
O --> Q[各部分内容]
P --> R[草稿]
P --> S[工作基线]
P --> T[基线候选]
P --> U[基线]
Q --> V[执行摘要]
Q --> W[引言]
Q --> X[范围和职权范围]
Q --> Y[方法使用]
Q --> Z[应用]
Q --> AA[基础设施]
Q --> AB[用户任务场景]
Q --> AC[任务负载矩阵]
Q --> AD[监测和指标]
Q --> AE[服务需求和预测]
Q --> AF[服务层级]
Q --> AG[第三方]
Q --> AH[用户配置文件]
Q --> AI[使用场景]
综上所述,云容量管理是一个复杂而系统的过程,需要我们全面了解相关概念和技术,结合企业的实际情况,制定切实可行的管理策略和计划。只有这样,才能实现云资源的高效利用和企业的可持续发展。
超级会员免费看
923

被折叠的 条评论
为什么被折叠?



