服务器硬盘掉了两块的解决过程

一.服务器数据恢复故障描述

需要进行数据恢复的服务器共10个磁盘柜,每个磁盘柜满配24块硬盘。其9个存储柜用作数据存储使用,另外1个存储柜用作元数据存储使用。元数据存储里一共24块146G硬盘,其中设置了9组RAID 1阵列,1组4盘位RAID 10阵列,4个热备硬盘。
数据存储中,每6块硬盘设置一组RAID 5阵列,共36组RAID,这36组RAID阵列中,又分为2个存储系统。其中1个存储系统中,一组RAID由于2块硬盘先后故障离线,导致RAID阵列失效,整个存储系统瘫痪,无法使用。
存储及文件系统架构大致如下图一:

注:Meta_LUN(元数据卷)    Data_LUN(用户数据卷)

二.磁盘备份

为避免服务器数据恢复过程中由于误操作对原始磁盘造成二次破坏, 先使用WinHex软件对客户的存储环境进行备份。
备份过程如下图二所示:

对故障RAID中的6块成员盘进行编号标记,将硬盘从存储柜中拔出,接入到准备好的备份平台上,对6块硬盘进行备份。
对其余没有出现故障的RAID阵列,进行存储层面的备份。使用光纤线缆将备份平台和存储设备连接,进入昆腾存储设备管理界面配置备份平台和存储设备可以正常通信,使用WinHex软件对RAID中的LUN进行镜像备份。
在备份过程中发现故障RAID中的1块故障硬盘存在大量的坏道区域,在备份的过程出现故障,无法继续备份。对故障硬盘进行开盘更换固件,并使用PC3000工具进行修复后,硬盘可以继续备份,但坏道仍然存在。图三:

部分镜像文件

三.数据分析

先对故障的RAID阵列进行分析,获取到相关的RAID信息,使用WinHex软件对RAID阵列进行虚拟重组,并将RAID中的LUN恢复成镜像文件。在分析过程中发现,损坏较严重的硬盘为后离线硬盘,由于此硬盘存在大量坏道,可能对恢复结果产生影响。
登陆昆腾存储设备的管理界面,获取到StorNext文件系统中卷相关的一些基本信息,如下图四:

继续对StorNext文件系统中的Meta卷和Data卷进行分析,客户的StorNext文件系统中,包含2个Data卷,完整的Data卷都是由多组RAID中的LUN组成的,对这些LUN进行分析,得到LUN之间组合的算法规律,虚拟重组出完整的Data卷。
图五:

分析Meta卷,对Meta卷中的节点信息和目录项信息,以及Meta卷和Data之间的对应关系进行分析,针对一个Meta卷管理多个Data卷的情况,研究得到Meta卷到Data卷的索引算法。文件节点如下图六:

目录块如下图七:

四.数据恢复

通过分析研究我们已经获取到了恢复工作所需信息,开始编写程序,扫描Meta卷中的节点信息和目录项信息,同时对目录项和节点进行解析,获取完整的文件系统目录结构,解析节点中的指针信息,将这些信息记录在数据库中。
文件信息如下图八:

编写文件提取程序,读取数据库,根据解析出的信息以及两个Data卷之间的聚合算法对数据进行提取。

五.恢复结果

对生成出的数据进行随机抽样检测,数据没有问题。将客户所需文件提取到本地,确认提取完成后,到客户线程进行数据移交。数据移交完成,客户对数据恢复结果表示满意。虽然故障硬盘存在有坏道的情况,但万幸主要数据没有遭到破坏,数据恢复工作圆满完成。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/31380569/viewspace-2654481/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/31380569/viewspace-2654481/

<think>我们参考了上述引用中的相关信息,特别是引用[3]中关于Ubuntu Server 16.04安装并用两块硬盘做RAID1的步骤,以及引用[5]中关于使用两块硬盘做RAID1的建议。下面将详细介绍在服务器上配置两块硬盘为RAID1的步骤。 ### 配置两块硬盘为RAID1的步骤 RAID1(镜像)通过将相同的数据同时写入两块硬盘来实现数据冗余。如果其中一块硬盘发生故障,另一块硬盘可以继续工作,从而保证数据的安全性和系统的可用性。以下是配置步骤: 1. **准备工作**: - 确保服务器两块相同容量、相同型号的硬盘(推荐)。 - 备份重要数据,因为配置RAID过程中可能会清除硬盘上的所有数据。 - 准备操作系统安装介质(如Ubuntu Server安装U盘)。 2. **进入RAID配置界面**: - 启动服务器,在开机自检(POST)时,根据提示进入RAID控制器的配置界面(通常是按`Ctrl+R`、`Ctrl+H`或`F2`等,具体取决于服务器品牌和RAID卡型号)。 - 如果服务器使用软件RAID(如Linux的mdadm),则可以在操作系统安装过程中或安装后配置。 3. **创建RAID1阵列**: - 在RAID配置界面中,选择创建新的RAID阵列。 - 选择RAID级别为RAID1(Mirror)。 - 从可用硬盘列表中选择两块硬盘,将它们添加到阵列中。 - 确认配置并保存退出。 4. **安装操作系统**: - 使用操作系统安装盘启动服务器。 - 在安装过程中,当进入分区步骤时,选择手动分区(Manual Partitioning)。 - 将RAID1阵列识别为一个物理设备(通常显示为`/dev/md0`或类似名称)。 - 在RAID设备上创建所需的分区(如`/boot`、`swap`、`/`、`/home`等),并设置挂载点。 - 完成分区后,继续安装操作系统。 5. **验证RAID1状态**: - 安装完成后,进入操作系统。 - 打开终端,使用以下命令检查RAID状态: ```bash cat /proc/mdstat ``` 或者使用`mdadm`命令: ```bash sudo mdadm --detail /dev/md0 ``` 输出中应显示两块硬盘处于正常状态(`[UU]`),表示RAID1工作正常。 6. **监控和故障处理**: - 定期检查RAID状态,确保没有硬盘故障。 - 如果一块硬盘故障,RAID1会继续工作,但需要尽快更换故障硬盘。更换后,RAID会自动重建镜像。 ### 注意事项 - **硬件RAID vs 软件RAID**:硬件RAID由RAID卡管理,性能较好且不占用系统资源;软件RAID(如Linux的mdadm)依赖操作系统,但配置灵活且无需特殊硬件。 - **热备盘**:如果需要更高的可靠性,可以考虑添加一块热备硬盘(Hot Spare),当RAID1中的硬盘故障时,热备盘会自动替换故障盘并重建阵列(如引用[2]所述)。 - **系统盘克隆**:如引用[5]建议,系统盘配置完成后,可以将其克隆备份,以便快速恢复。 ### 相关问题 1. RAID1和RAID5在性能和可靠性上有何区别? 2. 如何在Linux系统中使用mdadm工具配置软件RAID1? 3. 服务器硬盘故障后,如何更换RAID1阵列中的硬盘并重建阵列? 通过以上步骤,您可以在服务器上成功配置两块硬盘为RAID1,实现数据冗余和高可用性。如有其他问题,欢迎继续咨询。</think>### 在服务器上配置两块硬盘为RAID 1的步骤 RAID 1(镜像)通过实时复制数据到两块硬盘实现冗余,任何一块硬盘故障时系统仍可正常运行。以下是详细操作流程: --- #### **一、准备工作** 1. **硬盘要求** - 两块相同容量和型号的硬盘(推荐企业级硬盘)[^3][^5]。 - 备份所有数据(配置过程会清空硬盘)。 2. **工具准备** - 操作系统安装介质(如Ubuntu Server)[^3]。 - 服务器RAID配置工具(硬件RAID卡或软件工具如`mdadm`)。 --- #### **二、配置方法(以硬件RAID卡为例)** 1. **进入RAID配置界面** - 重启服务器,在开机自检时按提示键(如`Ctrl+R`、`F2`或`Delete`)进入RAID卡管理界面[^3][^4]。 2. **创建RAID 1阵列** ```plaintext 1. 选择 "Create Virtual Drive" 2. RAID Level: 选择 RAID 1 3. 勾选两块目标硬盘 4. 确认参数(如条带大小默认64KB) 5. 保存配置并退出[^3][^5] ``` ![RAID 1配置示意图](https://example.com/raid1-config.png) *图:RAID 1配置界面示意图(来源:服务器厂商文档)* 3. **安装操作系统** - 从安装介质启动,进入分区步骤时: - 将RAID 1阵列识别为单一设备(如`/dev/sda`)。 - 划分分区(例如:`/boot`、`swap`、`/`)[^3]。 --- #### **三、软件RAID配置(Linux系统)** 若使用软件RAID(如Ubuntu),需通过`mdadm`工具: ```bash # 1. 安装工具 sudo apt install mdadm # 2. 创建RAID 1设备 sudo mdadm --create /dev/md0 --level=1 --raid-devices=2 /dev/sdb /dev/sdc # 3. 格式化并挂载 sudo mkfs.ext4 /dev/md0 sudo mount /dev/md0 /mnt/data # 4. 保存配置 sudo mdadm --detail --scan | sudo tee -a /etc/mdadm/mdadm.conf sudo update-initramfs -u ``` *注:`/dev/sdb`和`/dev/sdc`需替换为实际硬盘标识[^3]。* --- #### **四、验证与监控** 1. **检查状态** ```bash cat /proc/mdstat # 查看RAID状态 mdadm --detail /dev/md0 # 查看详细信息 ``` 正常状态显示 `[UU]`(两块硬盘均在线)[^3]。 2. **故障处理** - 硬盘故障时,RAID 1仍可读写。 - 更换故障硬盘后,执行重建: ```bash mdadm /dev/md0 --add /dev/sdX # 添加新硬盘 ``` 系统自动同步数据[^2][^3]。 --- #### **五、注意事项** 1. **性能与容量** - 写入速度略低于单盘(需复制数据)。 - 可用容量为单块硬盘容量(例如:2×1TB → 1TB可用)[^5]。 2. **适用场景** - 系统盘或关键数据存储(如数据库日志)[^5]。 - 不适合大规模存储(成本较高)[^1][^5]。 3. **备份策略** - RAID 1非替代备份,仍需定期异地备份[^2]。 --- ### 相关问题 1. RAID 1和RAID 5在数据安全性和性能上有何区别? 2. 如何为RAID 1阵列添加热备盘(Hot Spare)? 3. 服务器硬盘故障后,如何在不关机的情况下更换RAID 1中的硬盘? [^1]: 一块硬盘服务器,服务器4块硬盘做raid几 [^2]: 服务器硬盘数据冗余,服务器配置RAID5 [^3]: Ubuntu Server 16.04 安装并用两块硬盘做RAID1 [^4]: Cisco服务器硬盘状态jbod,如何为服务器硬盘配置RAID或JBOD模式 [^5]: 计算服务器系统盘: 一块硬盘? 两块硬盘? 还是RAID1?
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值