某业务Redis全主模式集群故障分析

      某业务redis集群存在较大风险,可能红包业务受影响,为避免业务受影响,请调整红包redis集群方式为:主从方式,避免单点故障。(目前集群模式为全主模式,服务器故障了,连接此服务器业务就会受影响。)

   一、问题描述:

              1. 2022年10月25日   182.39.46.60告警存在/app 只读模式告警,平台维护排查此服务器一块 硬盘坏了。  

                   维护厂家回复:此raid组和分区方式导致坏一个磁盘,导致数据无法恢复,必须重装系统。

                   业务影响:       由于此服务器服务红包雨业务,当前长时间无此业务,所以业务没受影响。

              2. 2022年8月17日     182.39.46.61也出现同样的问题,一块磁盘坏了。最终紧急重装系统,重新配置redis恢复。

      二、问题分析

              1.据厂家反馈这批型号的浪潮服务器故障率非常高,在省公司100多台,厂家接手维保以来坏了二十多台主板

              2.此批次服务器raid组和分区方式,目前其中一块磁盘损坏,可能无法恢复数据,必须重装系统。(近期已发生2例)

              3.  182.39.46.60-63  这4台服务都是同一批次的浪潮PC服务器,所以其他服务器出现故障概率较高,存在较大风险

              4. 182.39.46.60-63 这套redis集群采用全主模式,某台服务器出问题,就会出现连接此服务器上业务受影响。  

      三、建议

              1.  请业务测尽快调整redis集群模式,避免目前单点故障,造成业务影响。

              2.  另我这边跟平台、厂家讨论下,这个批次服务器有无其他预防措施。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

R_水手

感谢你对创作者的支持

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值