云可靠性:概念、模型与挑战
1. 云可靠性概述
随着对资源成本效益和灵活扩展的需求不断增加,云计算应运而生并日益壮大。有预测显示,云计算市场规模将从 2017 年的 1460 亿美元增长到 2020 年的 2360 亿美元,同时各类云服务提供商提供的特定行业服务也将不断增长。
然而,由于从面向产品的架构向面向服务的架构转变,传统软件的可靠性模型无法直接应用于云环境。云应用和服务的分层结构增加了其可靠性过程的复杂性。云服务提供商(CSP)和云消费者在签订服务级别协议(SLA)时,共同承担确保可靠服务或应用的责任,但责任的程度因云服务类型而异。
在云环境中应用可靠性概念的主要目标包括:
- 最大化服务可用性。
- 最小化服务故障的影响。
- 最大化服务性能和容量。
- 增强业务连续性。
云环境中的可靠性不仅包括可量化的容错能力,还包括一些定性特征,如遵守合规标准、快速适应不断变化的业务需求、实施开放标准、便捷的数据迁移政策和退出流程等。同时,云环境中存在多种类型的故障,如请求超时故障、资源缺失故障、溢出故障、网络故障、数据库故障以及软硬件故障等。
2. 现有云可靠性模型
不同研究人员在云计算环境领域提出了许多可靠性模型,研究领域涵盖云模型中的交错故障、调度可靠性、云服务质量、同态加密方法以及基于多状态系统的可靠性评估等。以下是一些典型的模型:
|模型提出者|模型特点|
| ---- | ---- |
|Dai 等人(2009)|基于图论、马尔可夫模型和排队论提出云服务可靠性模型,考虑处理速度、数据传输量、带宽和故障率等参数,集成图论和贝叶斯方法开发评估
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



