Orchestrator介绍四-失败/故障检测

DBA之路

已于 2024-10-21 19:29:03 修改

阅读量941

点赞数

分类专栏： # Orchestrator 文章标签：数据库

于 2023-08-29 17:31:35 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_48154829/article/details/132562720

版权

Orchestrator 专栏收录该内容

22 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

目录

Orchestrator-失败/故障检测

传统监控主库方法

Orchestrator检测主库的方法

检测与恢复

一些失败场景的详细解释

DeadMaster：（会发生切换）

DeadMasterAndSomeReplicas:（会发生切换）

UnreachableMaster:（不会发生切换）

DeadIntermediateMaster:（会发生切换）

UnreachableMasterWithLaggingReplicas:

LockedSemiSyncMaster

MasterWithTooManySemiSyncReplicas

不会被认为失败/故障的场景

进行失败/故障分析的方法

Orchestrator-失败/故障检测

orchestrator使用整体方法(orc服务节点和复制拓扑中的从副本)探测主库和中间主库的故障。

传统监控主库方法

例如监控工具会探测主库，当无法连接或者查询主库的时候会发出告警。但是这种方法很容易收到网络故障的影响而误报。这种简单的方法通过进行多次间隔为t的测试来减少误报。在某些情况下，这回减少误报的可能性，但在真正发生故障时会增加响应时间。

Orchestrator检测主库的方法

Orchestrator 会利用复制拓扑监控主库。它不仅监控master本身，还利用其从库监控主库的存活。例如，要诊断主库宕机的场景，orchestrator 必须：

连接不上主库
能够联系主的副本，并确认它们也看不到master

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

DBA之路 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。