故障现象:
1. 数据库SDS集群两个节点全部宕机
2. 数据库服务器上无法执行parted -l ;multipath -ll等操作,扫不到磁盘
3.数据库侧判定为存储故障或主机故障,反正是操作系统认不到磁盘
存储工程师排查:
1. 发现该存储映射给其他主机的磁盘正常使用
2. 存储新划分一个磁盘,映射给故障的主机,可以正常识别
3. 数据库工程师在parted划分磁盘之后,又无法识别了partprobe无法执行
集成商:
1.重启故障的主机,无效果
在最后绝望的时刻,存储工程师重启了整个磁盘阵列,所有问题迎刃而解。
这是什么鬼?
这是什么套路?
问题在哪里?
难道下次还重启磁盘阵列?

数据库SDS集群遭遇双节点宕机,操作系统无法识别磁盘,存储映射及磁盘划分后问题依旧。存储工程师发现其他主机使用正常,尝试重启磁盘阵列后,所有问题得到解决。此案例揭示了存储阵列在特定情况下的关键作用。
1164





