浅谈对磁盘阵列RAID的认识与理解
(1)对于一般企业来讲性能最好的为raid0,性价比最高的raid5.总体来看各种磁盘阵列除了raid1以外,磁盘将数据存储并不是常规意义上的完整存储,磁盘是将数据进行了分份存储,以raid0为例,raid0最少使用两块盘,但是raid0的存储方式是将两块甚至多块盘中的数据整合后才构成原数据,所以将数据分成两份并不是指数据的复制粘贴,而是经过一定的规律进行划分.
(2)raid0:最少为两块盘,将一份数据分为两份,分别存储在两块盘中,假如每个盘容量为1T,实际容量为2T,校验方式为 数据x+数据y此方式性能最好,并且存储容量最大,但是不能提供相应的数据冗余与保护.
(3)raid5:最少为三块盘,将一份数据分为2份外加一个校验码(对应下方x),数据的保存方式会变为:
A数据1+A数据2=A数据x
B数据x+B数据1=B数据2
C数据1+C数据x=C数据2
这样的存储方式会提高数据的冗余性(重复性),也就是提高了数据的安全程度,但是实际存储量会成n-1,举例来说明,假设3块磁盘来做raid5,每一块为1T,那这个raid5的总存储量为2T(3块1T盘应为3T,但是raid5中会出现条带校验,也就是上面算法中提到的数据x,所以实际的有用数据量会为n-1).raid5的性能不如raid0,但是其可以保护数据,允许坏一块盘,也只能坏1块盘,当有一块盘出现故障坏盘情况时,我们可以根据另外两块盘的数据来对坏的那块盘的数据进行恢复(实际操作原理类似于解一元一次方程),目前关于磁盘阵列raid5出现了热备盘.其运行方式如下:
了解到raid5的存储方式最少3块盘,并且数据以条带方式存储在各个盘符上,我们假设 A数据以此种方式进行存储,盘1存储A数据1,盘2存储A数据2,盘3存储A数据x(校验码),热备盘在没有发生坏盘的情况下会进行热备份,当出现坏盘情况时,热备盘可以立即顶替坏盘,并切根据其他两块盘的数据读写出坏盘数据,从而顶替坏盘.
(4)raid6:最少为4块盘,raid6的构成与raid5类似,如果把raid5恢复数据看作一个一元一次方程的话,我们就可以把raid6看做一个二元一次方程,这样的话我们可以允许raid6坏两块盘.也只允许坏两块盘.
A数据1+A数据2+A数据3=A数据x
B数据x+B数据1+B数据2=B数据3
C数据1+C数据x+C数据2=C数据3
D数据1+D数据2+D数据x=D数据3
既然radi5可以实现数据的基础保护,raid6的数据保护更强,但是同时也更耗费资源,成本较大
(5)raid1:最少为2快盘,并且架构必须为偶数盘,raid1可以理解为镜像原理,数据不会像前几个raid一样,将数据分成份进行存储(即使是raid0也是将数据分成两份存储,这样大大提高了存储性能),而是将数据复制一份,存储到另一块盘符上A数据=A数据这样做确实提供了更高的可修复性,但是同时也降低了磁盘的使用率,举例来讲,如果我们用两块1T的盘来做raid1,一份数据会类似复制粘贴存储在两块盘上,那么我们真正有用的数据只有1T,另外1T可以看作备份,这样做会增加存储的成本同时也不会提高存储的效率,但是提升了数据回复的速度与可靠程度,这种模式一般用于及其重要的数据存储.
(6) raid10:与之相对的是raid0+1,我们可以将raid10拆开,看作raid1+0,这样有利于理解,raid1是一种镜像存储方式,raid0是通过将数据一分为二从而提高了数据存储的性能,以图示为例