Redis哨兵模式

在主从模式的Redis系统中,从数据库在整个系统中起到了数据冗余备份和读写分离的作用,但是当数据库遇到异常中断服务后,我们只能通过手动的方式选择一个从数据库来升格为主数据库,显然这种方式很麻烦需要人工介入,这时通过哨兵模式可以实现自动化的系统监控和故障恢复。

哨兵模式

什么是哨兵

哨兵的作用是监控Redis系统的运行状态,功能包括以下两个:
在这里插入图片描述
哨兵是一个独立的进程,使用哨兵的典型结构图如下:
在这里插入图片描述
在这里插入图片描述

实现哨兵模式

配置一主两从

主服务器端口号6379,两个从服务器端口分别为:6380和6381.
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

哨兵模式配置

修改和redis.conf同级目录下的sentinel.conf文件.
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
启动哨兵模式
在这里插入图片描述
哨兵模式只需要配置其监控的主数据库即可,哨兵会自动发现所有复制该数据库的从数据库。
关闭6379master测试
查看6379状态
在这里插入图片描述
关闭6379等待一会查看哨兵进程界面
在这里插入图片描述
当看到如上图的信息后,我们再查看6380的时候,发现该节点已经变成了master了。
在这里插入图片描述
再启动6379我们发现该实例依然是slave并不会改变
在这里插入图片描述

一个哨兵监控多个Redis主从系统

配置

sentinel monitor mymaster 127.0.0.1 6380 2
sentinel monitor othermaster 192.168.88.60 6380 4

监控不同数据库使用不同的配置参数:

sentinel down-after-millisenconds mymaster 60000
sentinel down-after-millisenconds othermaster 10000

实现原理

哨兵启动后会与要监控的主数据库建立两条连接
在这里插入图片描述
和主数据库连接建立完成后,哨兵会使用连接2发送如下命令:
在这里插入图片描述
首先,发送INFO命令会返回当前数据库的相关信息(运行id,从数据库信息等)从而实现新节点的自动发现,前面提到的配置哨兵时只需要监控Redis主数据库即可,因为哨兵可以借助INFO命令来获取所有的从数据库信息(slave),进而和这两个从数据库分别建立两个连接。在此之后哨兵会每个10秒钟向已知的主从数据库发送INFO命令来获取信息更新并进行相应的操作。
  接下来哨兵向主从数据库的_sentinel_:hello 频道发送信息来与同样监控该数据库的哨兵分享自己的信息。发送信息内容为:
在这里插入图片描述
在这里插入图片描述
哨兵通过监听的_sentinel_:hello频道接收到其他哨兵发送的消息后会判断哨兵是不是新发现的哨兵,如果是则将其加入已发现的哨兵列表中并创建一个到其的连接(哨兵与哨兵只会创建用来发送PING命令的连接,不会创建订阅频道的连接)。

实现了自动发现从数据库和其他哨兵节点后,哨兵要做的就是定时监控这些数据和节点运行情况,每隔一定时间向这些节点发送PING命令来监控。间隔时间和down-after-milliseconds选项有关,down-after-milliseconds的值小于1秒时,哨兵会每隔down-after-milliseconds指定的时间发送一次PING命令,当down-after-milliseconds的值大于1秒时,哨兵会每隔1秒发送一次PING命令。例如:
// 每隔1秒发送一次PING命令
sentinel down-after-milliseconds mymaster 60000
// 每隔600毫秒发送一次PING命令
sentinel down-after-milliseconds othermaster 600

主观下线

当超过down-after-milliseconds指定时间后,如果被PING的数据库或节点仍然未回复,则哨兵认为其主观下线(subjectively down),主观下线表示从当前的哨兵进程看来,该节点已经下线。

客观下线

在主观下线后,如果该节点是主数据库,则哨兵会进一步判断是否需要对其进行故障恢复,哨兵发送SENTINEL is-master-down-by-addr 命令询问其他哨兵节点以了解他们是否也认为该主数据库主观下线,如果达到指定数量时,哨兵会认为其客观下线(objectively down),并选举领头的哨兵节点对主从系统发起故障恢复。这个指定数量就是前面配置的 quorum参数。
在这里插入图片描述
该配置表示只有当至少有两个Sentinel节点(包括当前节点)认为该主数据库主观下线时,当前哨兵节点才会认为该主数据库客观下线。接下来选举领头哨兵。

选举领头哨兵

在这里插入图片描述

故障恢复

选出领头哨兵后,领头哨兵将会开始对主数据库进行故障恢复。步骤如下
1.首先领头哨兵将从停止服务的主数据库的从数据库中挑选一个来充当新的主数据库。
在这里插入图片描述
2.选出一个从数据库后,领头哨兵将向从数据库发送SLAVEOF NO ONE命令使其升格为主数据库,而后领头哨兵向其它从数据库发送 SLAVEOF命令来使其成为新主数据库的从数据库,最后一步则是更新内部的记录,将已经停止服务的旧的主数据库更新为新的主数据库的从数据库,使得当其恢复服务时自动以从数据库的身份继续服务

<think>我们正在讨论Redis哨兵模式的配置与实现。根据引用内容,用户提供了几个配置示例,但我们需要系统地解释哨兵模式的配置步骤和实现原理。步骤1:理解哨兵模式Redis哨兵(Sentinel)是一个分布式系统,用于管理多个Redis实例(主从结构),提供自动故障转移(failover)和高可用性。哨兵模式的核心功能包括:-监控:哨兵定期检查主节点和从节点的状态。-通知:当被监控的实例出现问题时,哨兵可以通过API通知系统管理员或其他程序。-自动故障转移:如果主节点故障,哨兵会启动故障转移过程:选择一个从节点晋升为主节点,并让其他从节点复制新的主节点。-配置提供者:客户端可以通过哨兵获取当前主节点的地址。步骤2:配置哨兵模式的基本步骤根据引用[2]和引用[3],配置哨兵模式通常包括以下步骤:1.准备Redis主从结构:首先需要配置一个主节点和至少一个从节点。例如:-主节点:运行在127.0.0.1:6380-从节点1:运行在127.0.0.1:6381-从节点2:运行在127.0.0.1:63822.创建哨兵配置文件:每个哨兵实例需要一个配置文件。通常,我们会创建多个哨兵实例(通常为奇数,如3个)以实现哨兵自身的容错。以配置三个哨兵为例(端口分别为26380,26381,26382):-复制模板配置文件:创建三个哨兵配置文件(如sentinel-26380.conf,sentinel-26381.conf,sentinel-26382.conf)。-修改每个配置文件,主要设置:port<哨兵端口>#每个哨兵使用不同端口daemonizeyes#以守护进程方式运行sentinelmonitor<master-group-name><master-ip><master-port><quorum>sentinelauth-pass<master-group-name><password>#如果主节点有密码例如:sentinelmonitormymaster127.0.0.163802sentinelauth-passmymaster123456注意:`<quorum>`(法定人数)是判定主节点故障至少需要的哨兵数量。这里设置为2,表示需要至少两个哨兵同意才能判定主节点故障。3.启动哨兵:redis-sentinel/path/to/sentinel-26380.confredis-sentinel/path/to/sentinel-26381.confredis-sentinel/path/to/sentinel-26382.conf4.验证:连接到一个哨兵实例,使用`infoSentinel`命令查看状态。步骤3:哨兵模式的工作原理-哨兵通过发送PING命令定期检查主从节点的健康状态。-如果主节点在配置的`down-after-milliseconds`时间内未回复,哨兵将其标记为“主观下线”。-当足够数量的哨兵(达到quorum)都将主节点标记为主观下线时,主节点被标记为“客观下线”。-然后,哨兵会选举一个领导者哨兵(使用Raft算法)来执行故障转移。-领导者哨兵选择一个从节点(通常选择数据最新的从节点)晋升为主节点,并让其他从节点复制新的主节点。-最后,哨兵更新配置:将旧主节点(如果重新上线)设置为新主节点的从节点。步骤4:注意事项-哨兵数量:通常至少需要3个哨兵以确保系统在部分故障时仍能正常工作(容忍一个哨兵故障)。-网络分区:哨兵系统需要大多数哨兵可达才能做出决策,因此奇数个哨兵(如3或5)可以避免脑裂。-客户端:客户端需要支持哨兵,能够通过查询哨兵获取当前主节点地址。步骤5:配置示例参考引用[2]中的配置片段,一个哨兵配置文件(如sentinel-26382.conf)可能如下:```plaintextport16382daemonizeyessentinelmonitormymaster127.0.0.163802sentinelauth-passmymaster123456```步骤6:启动和停止引用[3]展示了如何停止和启动所有节点(包括主从和哨兵)的示例命令。注意:生产环境中应避免直接使用kill命令,应使用服务管理工具。总结:Redis哨兵模式提供了高可用性,配置过程包括设置主从复制、配置多个哨兵实例以及启动哨兵。哨兵通过监控和自动故障转移确保Redis服务在节点故障时继续运行。§§相关问题§§1.Redis哨兵模式与集群模式有什么区别?2.如何配置哨兵的故障转移通知?3.哨兵模式在故障转移过程中如何处理客户端连接?4.如何监控哨兵系统的状态?</think>### Redis哨兵模式配置与实现 Redis哨兵(Sentinel)是一种高可用解决方案,用于监控主从架构中的Redis实例,实现自动故障检测和故障转移。以下是关键配置步骤和实现原理: #### **一、核心配置步骤** 1. **创建哨兵配置文件** 复制模板并修改端口和监听对象(每个哨兵独立配置): ```bash cp sentinel-26380.conf sentinel-26381.conf cp sentinel-26380.conf sentinel-26382.conf ``` 配置文件内容示例: ```plaintext port 16381 # 哨兵端口 daemonize yes # 后台运行 sentinel monitor mymaster 127.0.0.1 6380 2 # 监控主节点,2为法定同意数 sentinel auth-pass mymaster 123456 # 主节点密码 ``` [^2] 2. **启动哨兵进程** 分别启动三个哨兵节点: ```bash redis-sentinel sentinel-16380.conf redis-sentinel sentinel-16381.conf redis-sentinel sentinel-16382.conf ``` [^2] 3. **验证哨兵状态** 连接Redis执行命令查看哨兵信息: ```bash redis-cli -p 16381 info Sentinel # 输出主节点状态、从节点列表等 ``` 4. **故障转移流程** - 哨兵通过PING命令检测节点健康 - 主节点超时未响应 → 标记为**主观下线** - 多数哨兵确认 → 升级为**客观下线** - 选举领导者哨兵执行故障转移 - 选择数据最新的从节点晋升为新主节点 - 更新其他从节点复制目标 #### **二、关键参数解析** | 配置项 | 说明 | 示例 | |--------|------|------| | `sentinel monitor <name> <ip> <port> <quorum>` | 定义监控的主节点 | `sentinel monitor mymaster 127.0.0.1 6380 2` | | `sentinel down-after-milliseconds` | 判定节点失效的毫秒数 | 默认30,000ms | | `sentinel failover-timeout` | 故障转移超时时间 | 默认180,000ms | | `sentinel parallel-syncs` | 故障转移时同步新主的从节点数 | 默认1 | #### **三、实现原理** 1. **分布式监控** 多个哨兵节点组成集群,通过Gossip协议通信,避免单点故障。 2. **Raft共识算法** 故障转移时通过Raft选举领导者哨兵,需满足: $$ \text{同意票数} \geq \left\lfloor \frac{\text{哨兵总数}}{2} \right\rfloor + 1 $$ 3. **配置自动传播** 新主节点确认后,哨兵自动修改其他节点的`redis.conf`和`sentinel.conf`,更新主节点地址[^1]。 #### **四、注意事项** 1. **节点数量** 推荐部署**至少3个哨兵**(奇数个),法定人数(quorum)通常设为 $\frac{N}{2} + 1$(N为哨兵总数)。 2. **网络分区处理** 当网络分裂时,少数分区中的旧主节点会被置为只读模式,防止数据冲突。 3. **客户端集成** 客户端需支持哨兵协议,通过`SENTINEL get-master-addr-by-name`动态获取主节点地址。 > **故障转移演示**: > 当主节点(6380)宕机时,哨兵日志会显示: > ```plaintext > +sdown master mymaster 127.0.0.1 6380 # 检测到故障 > +vote-for-leader ... # 开始选举 > +failover-state-select-slave master mymaster # 选择新主 > +promote-slave slave 127.0.0.1:6381 ... # 提升从节点 > +switch-master mymaster 127.0.0.1 6380 127.0.0.1 6381 # 切换完成 > ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值