云环境的可用性、可靠性、性能与安全分析
1. 云环境中的故障与服务水平
在云环境中,一些在传统数据中心被认为罕见的故障却十分常见。例如,与具有组件冗余的低端服务器相比,EC2 实例的可靠性极低。传统数据中心的物理服务器很少会毫无预警地丢失,通常是某个组件先出现故障或发出预警,然后由冗余组件替换,从而实现无停机恢复。而在亚马逊云等环境中,EC2 实例最终会毫无预警地失败,这是必然的。
1.1 亚马逊网络服务(AWS)的服务水平
竞争对手在服务水平方面与亚马逊展开竞争。多数竞争对手在云服务中提供了强大的服务水平保障。亚马逊为 S3 提供 SLA 已有一段时间,最近才为 EC2 添加了正式的 SLA。S3 承诺在每个日历月内对服务请求的响应率达到 99.5%;EC2 则定义了更复杂的可用性服务水平,承诺一个区域内至少两个可用区的可用性达到 99.95%。
然而,这些服务水平并不能直接转化为你向客户承诺的内容,具体原因如下:
- 需要 S3 可用才能启动 EC2 实例。若 S3 的可用性为 99.5%,那么无论 EC2 表现如何,你启动新 EC2 实例的成功率也只有 99.5%。此限制同样适用于快照和创建卷。
- 只要同一区域内两个可用区的可用性达到 99.95%,EC2 就算达到服务水平,即便整个可用区不断出现故障。
- 你需要设计应用程序,使其能够可靠地支持各种需求。
1.2 能否信任 AWS 的承诺
EC2 基于已知技术(Xen)进行定制,解决的是虚拟化这一常见问题;而 S3 则是自主研发的独特系统。从经验来看,EC2 的问题通常与普通的数据中心问题相关,而 S3 的问题则涉及到其专有
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



