IBM V3500存储更换控制器实例

本文介绍了一次紧急维护过程,针对客户单位因存储控制器损坏导致部分虚拟机无法启动的问题,通过更换控制器及磁盘操作成功恢复业务。涉及vSphere虚拟化平台、IBM存储设备及其管理软件。


今天一早接到客户电话,说单位内部分用户不能访问网络,我登录检查之后发现存储的一个控制器损坏导致,主要原因概述如下。

当前客户核心业务运行在vSphere虚拟化平台,该单位有3台HP服务器+1台IBM 3524存储,服务器与存储之间采用SAS接口连接,其中2台HP服务器使用SAS线连接到A控制器,另1台HP服务器使用SAS线连接到B控制器,服务器与存储之间无冗余连接。3台HP服务器安装ESXi 6.0配置成HA,所有虚拟机都保存在IBM 3524存储中,当A控制器损坏之后,前2台HP服务器丢失到存储的连接导致部分虚拟机不能启动,因为HA中损坏了2台服务器,HA失效。知道原因之后,让客户将其中1台HP服务器的SAS线连接到B控制器的空闲端口(当前IBM 3524有两个控制器,每个控制器有2个SAS接口,所以B控制器当前有一个端口空闲),将这台服务器重新启动,此时会有2台服务器可以正常工作,之后将业务虚拟机启动,此时单位应用暂时恢复。

在业务恢复之后,因为当前的存储已经过保,所以申请购买新的同型号的控制器,控制器到货之后更换损坏的A控制器,在更换的过程中又发现Slot 8的磁盘即将失效,在更换控制器后同时替换了即将失效的磁盘,下面介绍一下主要的过程与步骤。

(1)进入IBM DS Storage Manager管理软件,可以看到A控制器已经离线,同时有两块盘有黄色的五星符号,如图1-1所示。

图1-1 已经离线

【说明】当前示意图中Slot 3与Slot 8都有黄色的五星符号,其中Slot 3里面有一块磁盘,因为最初该盘位有点故障帮此盘位未分配到陈列中,故当前磁盘未分配未使用,但此磁盘是一块可用的磁盘,可以将其从盘位取出,放到其他需要的位置;而Slot 8分配为Array-2逻辑磁盘,该磁盘有数据丢失的风险。

(2)在"Recovery Guru"的进一步检查中,看到第8盘位的磁盘即将失效,有数据丢失的风险,如图1-2所示。

图1-2 slot 8磁盘

(3)将损坏的A控制器从存储中拆下,更换上新购置的控制器。

(4)在存储管理中,右击A控制器,在弹出的快捷菜单中选择"Advanced→ Place→ Online"将其置于在线状态,如图1-3所示。

图1-3 将控制器置于在线

(5)控制器处于在线状态,如图1-4所示。

图1-4 控制器在线

但控制器在线后,连接A控制器的服务器没有发现LUN,近一步检查发现A控制器的flash状态不对,如图1-5所示。

图1-5 A控制器的flash状态不对

估计控制器在快递过来的过程中,可能有颠簸或其他原因导致控制器中的SD卡(是一个8GB的高速缓存卡)松动,或者有问题。将新安装上的控制器设置为"离线状态",打开控制器,将原来损坏的控制器的SD卡插到新购置的控制器中。

(6)右击A控制器,在弹出的快捷菜单中选择"Advanced→ Place→ Offline"将其置于离线状态,如图1-6所示。

图1-6 将控制器置于离线状态

(7)在弹出的"Confirm Place Offline"对话框中单击"yes"按钮确认,如图1-7所示。

图1-7 确认设置为离线

(8)当控制器A处于离线之后,拆下控制器,如图1-8所示。然后换上原来损坏控制器的SD卡,重新插上控制器。

图1-8 控制器处于离线状态

(9)再次将控制器设置为在线状态,此时看到SD卡状态正常,如图1-9所示。

图1-9 控制器正常

此时连接到A控制器的服务器应该能发现存储分配的LUN,如果不能发现LUN,则可以在"Storage & Copy Services",右击LUN在弹出的快捷菜单中选择"Change→ Ownership/Preferred Path"选择"Controller in Slot A",如图1-10所示。

图1-10 更换LUN到A控制器

对于盘位8即将失效的磁盘,可以将其置于"Fail"然后用热备磁盘代替,然后在盘位8换上新的磁盘即可,主要步骤如下。

(1)右击Slot 8的磁盘在弹出的快捷菜单中选择"Advanced→ Fail",如图1-11所示。

图1-11 将磁盘设置为失败

(2)在弹出的"Confirm Fail Drive"对话框中输入yes然后单击"OK"按钮,如图1-12所示。

图1-12 确认设置

(3)右击Slot 6(这个盘位的磁盘是热备磁盘),在弹出的快捷菜单中选择"Hot Spare Converage",如图1-13所示。

图1-13 热备磁盘转换

(4)在弹出的"Hot Spare Drive Options"对话框中选择"Automatically assign drives",然后单击"OK"按钮,如图1-16所示。

图1-16 自动分配驱动器

(5)在"Replace Drives"对话框中将显示将Slot 8的失效的磁盘替换到Slot 6,如图1-17所示。

图1-17 替换驱动器

(6)返回到"Storage & Copy services"对话框,浏览LUN可以看到涉及到逻辑磁盘会重建,如图1-18所示。当时的时间是10点02。

图1-18 磁盘重建

(7)此时可以将盘位8的磁盘拆下,换上新的同容量的磁盘。等图1-18重构完成之后,盘位8的磁盘会被替换回来,如图1-19所示。此时盘位8的磁盘有个黄色的五星标志,而盘位6的有个红色的十字标志。

图1-19 替换磁盘

(8)在"Storage & Copy services"对话框浏览涉及到的LUN,可以看到状态变为"Copyback Progress data unavailable",当前时间是22:23分,复制过程进行了大约60%,如图1-20所示。因为在替换Slot 8的时间大约是上午10点,时间到现在大约过了12小时,以此计算,整个更换、替换磁盘所需要时间大约15小时。

图1-20 复制过程

(9)第二天早晨7点33分检查,复制进度已经完成,如图1-21所示。

图1-21 复制完成

(10)在"Hardware"选项卡中单击Slot 8,可以看到当前磁盘已经分配到Array-2,原来Slot 6仍然变为热备磁盘,如图1-22所示。至此整个维护完成。

wKiom1ipIAPgqmvyAAE9uhM9ObE170.png-wh_50

图1-22

跟我学配置磁盘阵列之2-DELL服务器篇视频课程

http://edu.51cto.com/course/course_id-8195.html

 

Storwize V3500 安装前的准备  Storwize V3500 硬件安装  Storwize V3500 系统初始化安装  Storwize V3500 GUI的使用  Storwize V3500 微码升级  Storwize V3500 存储配置  Storwize V3500主机连接配置  Storwize V3500高级功能配置  Storwize V3500 参考文档和常用链接安装前准备 Yesterday 's Plans For Al Of Our Tomorrows 安装前的准备 查看装箱单 识别硬件组件 验证环境要求 查看和安排机柜位置 包装外观 a8(1!+20 △ SaWtell △ IBM ShoaH Syster 设备组件识别 电出 Sam时sk 白白 安装环境要求 型号和类型 PSU 输入功率需求 最大翰入电流 最大功率输出 物值 2017-02A控制机柜,带有 12个3.5英寸驱动器插槽 358W 100v到240V单相 358W 1222BTU/小时 交流电源 针对100V为10A 2017-10A控制机柜,带有 405W 频率:50H到60针对240V为6A 405W 1383BTU/小时 24个2.5英寸驱动器插槽 Hz 环境 环境温度 海拔高度 相对湿度 最大湿球温度 10C到35°C 305到3000米 200W操作 50F到95°F) (-100到9840英尺 20%到80%非冷凝 400W操作 非操作 10°C到50°C 14°F到125°F 10%到90%非冷凝 305到12192米 存储 1000到40000英尺) 最大重里 机柜 高度 宽度 深度 驱动器就绪(无驱动器完全配置(带有驱动器模 模块 块〕 201702A型控制机柜,带有12个驱动87厘米(3448.3厘米 器插槽 英寸) (190英 556厘米 219英寸 180千克(39.6磅)283千克(622磅 2017-10A型控制机柜,带有12个驱动|87厘米(3443厘米556厘米 器插槽 英寸 19,0 (219英寸)19.0千克(418磅) 27.3千克(60.0磅 查看安排机柜位置 如果仅安装控制机柜(一个),请遵循以下准则: 将机柜放置在机架中便于査看和操作的位置,以便进行维护。该操作有助于机架保持稳固,并使两个或更多人 员能够安装和卸下机柜 注:如果您打算以后添加扩展机柜,请査看¨如果仅安装一个扩展机柜”情况下的准则。 如果安装一个控制机柜和一个或多个扩展机柜,请遵循以下准则: 如果有一个或多个扩展机柜,请将控制机柜放置在机架中央。将扩展机柜均衡分布在控制机柜的上方和下方 例如,将控制机柜放置在机架中央,以便于连线。 连接到控制机柜的SAS端口1的扩展机柜不能超过5个。 ·连接到控制机柜的SAS端口2的扩展机柜不能超过4个。 将机柜放置在一起;避免在机柜之间添加其他设备 ·当将第一个扩展机柜添加到控制机柜时,最好将该机柜直接添加到控制机柜的下方。 当添加第二个扩展杋柜时,最好将该机柜直接添加到控制机柜的上方。对于您添加的其他各扩展机桓,将 其交替地添加在控制机柜的下方或上方 ·将机柜放置在杋架中便于査看和操作的位置,以便进行维护。该操作有助于机架保持稳固,并使两个或更 多人员能够安装和卸下这些机柜 硬件安装 Yesterday 's Plans For Al Of Our Tomorrows 硬件安装 2个单元 卫底部导轨定位销孔 2个单元 2机柜安装螺钉孔 1底部导轨定位销孔 3]机架安装螺钉孔 2机架安装螺钉孔 4顶部导轨定位销孔
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值