服务器存储数据恢复环境:
一台infortrend存储中有一组由12块硬盘组建的RAID6阵列。RAID6阵列空间划分了一个LUN,映射到WINDOWS SERVER系统上。WINDOWS SERVER系统上划分了一个GPT分区。
服务器存储故障:
存储在运行过程中突然无法访问。管理员查看后发现raid6阵列中有3块盘离线。管理员通过非常规手段上线存储并开始rebuild,但通过主机访问时发现分区打不开,存储中所有数据均无法访问。咨询一些专业人士后基本上确认存储中的数据已经破坏。为避免情况进一步恶化,管理员中止rebuild,将存储关机后寻求当地一家数据恢复公司的帮助。经过该公司的全力恢复后,发现还是有大量数据丢失以及大量的文件无法打开。
RAID6支持2块硬盘同时掉线,但当2块以上的磁盘下线后,RAID6阵列便无法正常工作了。RAID6阵列中离线的3块盘一般不会同时下线,而是每间隔一段时间就有一块盘离线。这种情况下,如果将较早掉线的盘上线,就会与在线的盘进行RAID6算法同步,导致数据混乱,无法正常读取。
本案例中的情况就是如此。所幸是本案例中rebuild时间较短,在这段时间内同步的数据量不是很大。本案例中所涉及存储中数据文件非常多,且作为素材库,文件系统前面部分的空间存放老旧数据的可能性非常大;另外因为文件数量很多,所以较新文件的目录及节点索引应该都位于磁盘后部,所以同步操作可能对存储中整体数据的影响不大,破坏程度有限。
服务器存储数据恢复过程:
1、将故障存储中所有磁盘编号后取出,由硬件工程师进