高可用性系统与事务处理:原理、设计与实现
高可用性系统设计
在系统设计中,高可用性(HA)是一个重要的目标。为了更好地理解可用性,我们先来看不同“九”级别的可用性对应的停机时间,如下表所示:
| 可用性 | “九”的数量 | 每年允许的停机时间 |
| ---- | ---- | ---- |
| 99% | 两个九 | 3.65 天 |
| 99.9% | 三个九 | 8.75 小时 |
| 99.99% | 四个九 | 52.5 分钟 |
| 99.999% | 五个九 | 5.25 分钟 |
| 99.9999% | 六个九 | 31.5 秒 |
下面我们通过设计一个高可用性硬盘的例子,来详细阐述如何提高系统的可用性。设计要求如下:
1. 存储容量为 10GB,持续带宽为 1.25MBps,随机小访问时每秒 100 次 I/O。
2. 拥有独立的电源供应。
3. 具备“六个九”的可用性(99.9999%)。
4. 数据存储完全稳定,写入后不会丢失。
5. 平均无故障时间(MTBF)为 30 年(约 260,000 小时)。
我们使用现成但不可靠的组件来构建系统。首先,选用一个标准硬盘,其总故障的 MTBF 为 100,000 小时,电源的 MTBF 为 10,000 小时。同时,还需考虑磁介质故障,假设硬盘的残余介质故障率为 1 × 10⁻¹⁵ 误码率(BER),在最大带宽 1.25MB/秒(1.05 × 10⁷ 比特/秒)下持续工作,预计每 26,500 小时会出现一次故障。由于存在三种独立故障(硬盘总故障、电源故障、介质故障),系统的净 MTBF 为这
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



