概念
RAID(Redundant Array of Independent Disks,独立磁盘冗余阵列)是一种通过将多块硬盘组合成一个逻辑单元来提高存储性能、可靠性和容量的技术。
理解RAID技术,包括RAID0、RAID1、RAID5、RAID,计算:
1、RAID0、RAID1、RAID5、RAID10的有效容量;
2、RAID0、RAID1、RAID5、RAID10的速度;
3、RAID0、RAID1、RAID5、RAID10的可靠性
其中,假设上述磁盘阵列均采用4块硬盘,单块硬盘的故障率是0.1
假设单块硬盘的容量大小为T
RAID0
① 没有冗余,数据在各硬盘上条带化(striping),提高读写速度
有效容量=硬盘总容量
② 读写速度最快,因为没有冗余校验,所有数据均条带化并分布在多个磁盘上
读/写速度增加 = n × 单个硬盘速度(n为硬盘数量)
③ 没有冗余,一块硬盘损坏就会导致数据丢失
RAID0的故障概率=1-(1-单个硬盘故障率)^硬盘数量
故障概率=1-(1-0.1)^4=0.3439,约34.39%
RAID1
① 镜像冗余,数据完全复制到另一块硬盘上,提升了可靠性,但牺牲了存储空间
有效容量=一半的硬盘容量
② 读速度接近RAID 0,因为可以同时从多块硬盘读取,但写速度较慢,因为需要对硬盘进行镜像写入
读速度:接近 n × 单块硬盘速度
写速度:等于单块硬盘速度
③ 只要有一块硬盘正常工作,数据就可以恢复,只有在所有硬盘都故障时,数据才会丢失
RAID1的故障概率=单块硬盘的故障率×另一块硬盘的故障率
故障概率=0.1×0.1=0.01,约1%
RAID5
① 数据条带化并在硬盘之间分布奇偶校验(parity),即使一块硬盘故障也能恢复数据
有效容量=(硬盘数量-1)×单块硬盘容量
② 读速度较快,因为可以从多个磁盘并行读取数据,写入时需要计算和写入校验位,所以写速度较慢
读速度:接近 n - 1 × 单个硬盘速度
写速度:受到校验位计算影响,略低于读速度
③ 可以容忍一块硬盘故障,当第二块硬盘也故障时,数据丢失
RAID5的故障概率=第一块硬盘故障概率×其余硬盘中至少一块硬盘故障概率
故障概率=0.1×(1-(1-0.1)^3)=0.1×0.271=0.0271,约2.71%
RAID10
① RAID1+RAID0,结合了条带化和镜像冗余,既提高了性能,也提高了可靠性,但有效容量较低
有效容量=一半的硬盘容量
② 读速度和RAID 0类似,写速度和RAID 1相近
读速度:接近 n × 单个硬盘速度
写速度:等于单个硬盘速度
③ 只要同一对镜像中的两块硬盘都故障,数据就会丢失
RAID10的故障概率=每对硬盘中的一对都故障的概率
故障概率=0.1×0.1+0.1×0.1=0.02,约2%
总结
RAID类型 |
有效容量 |
读写速度 |
可靠性(故障率) |
RAID0 |
4T |
读/写速度最快 |
34.39% |
RAID1 |
2T |
读速度较快,写速度较慢 |
1% |
RAID5 |
3T |
读速度快,写速度稍慢 |
2.71% |
RAID10 |
2T |
读速度快,写速度适中 |
2% |