11.Redis哨兵面试题(高频面试题)

Redis 除了具有非常高的性能之外,还需要保证高可用,在故障发生时,尽可能地降低故障带来的影响,Redis提供了哨兵模式,来进行故障恢复。

哨兵主要负责做三件事:

①监控,监控主、从节点是否正常运行

②选主,Sentinel集群需要选择一个Leader来进行主从切换。

③通知,选主完成后,需要把新主库的连接信息通知给从库和客户端。

1.状态感知

哨兵启动后只指定了master的地址,要想知道整个集群中完整的拓扑关系怎么做呢?

哨兵每隔10秒会向每个master节点发送info命令,info命令返回的信息中,包含了主从拓扑关系,其中包括每个slave的地址和端口号。有了这些信息后,哨兵就会记住这些节点的拓扑信息,在后续发生故障时,选择合适的slave节点进行故障恢复。

那么有小伙伴会问,哨兵之间是如何通信的呢?

基于Redis提供的发布(pub)/订阅(sub)机制完成的。哨兵节点不会直接与其他哨兵节点建立连接,而是首先会和主库建立起连接,然后向一个名为"sentinel:hello"频道发送自己的信息(IP 和端口),其他订阅了该频道的哨兵节点就会获取到该哨兵节点信息,从而哨兵节点之间互知。

2.心跳检测

每一秒,每个 Sentinel 对 Master、Slave、其他哨兵节点执行PING命令,检测它们是否仍然在线运行,如果有节点在规定时间内没有响应PING命令,那么该哨兵节点认为此节点"主观下线"。

3.主观下线和客观下线

为什么需要客观下线机制?

因为当前哨兵节点探测对方没有得到响应,很有可能这两个机器之间的网络发生了故障,而 Master 节点本身没有任何问题,此时就认为 Master 故障是不正确的。

为了解决上述问题,客观下线应运而生,Sentinel一般会集群部署,引入多个哨兵实例一起来判断,就可以避免单个哨兵因为自身网络状况不好,而误判主库下线的情况。

假设我们有N个哨兵实例,如果有N/2+1个实例判断主库“主观下线”,此时把节点标记为“客观下线”,此时就可以做主从切换了。

4.选举哨兵领导者?

假设Sentinel 判断主库“主观下线”后,就会给其他 Sentinel 实例发送 is-master-down-by-addr 命令,接着,其他 Sentinel 实例会根据自己和主库的连接情况,做出赞成和反对决定。

假设我们有N个哨兵实例,如果有#{quorum}个实例赞成,此时这个 Sentinel 就会给其他 Sentinel 发送主从切换请求,其他 Sentinel 会进行投票,如果投票通过,这个 Sentinel 就可以进行主从切换了,这个投票过程被称为Leader 选举。其实整体思想和Zookeeper一样的。

在投票过程中,任何一个想成为 Leader 的哨兵,要满足两个条件:第一,拿到半数以上的赞成票;第二,拿到的票数同时还需要大于等于哨兵配置文件中的 quorum 值。

quorum一般我们都会配置成实例数量/2+1

此时会有小伙伴问,如果所有Sentinel都想成为Leader执行主从切换怎么办?

哨兵选举领导者的过程类似于Raft算法,每个哨兵都设置一个随机超时时间,超时后向其他哨兵发送申请成为领导者的请求,把超时时间都分散开来,在大多数情况下只有一个服务器节点先发起选举,而不是同时发起选举,这样就能减少因选票瓜分导致选举失败的情况

后期我会专门写一个专栏为大家介绍所有一致性算法,例如:Paxos、Raft、Gossip、ZAB等,到时候具体给大家讲解Sentinel是如何解决上述问题的。

5.谁来做新的Master?

选择新master过程也是有优先级的,在多个slave的场景下,优先级按照:slave-priority配置 > 数据完整性 > runid较小者进行选择。

用户可以通过 slave-priority 配置项,给不同的从库设置不同优先级。如果所有从节点的 slave-priority 值一致,那就看谁的数据更完整。

如何判断谁的数据更完整呢?

主库会用 master_repl_offset 记录当前的最新写操作在 repl_backlog_buffer 中的位置,而从库会用 slave_repl_offset 这个值记录当前的复制进度。此时,哪个从库的 slave_repl_offset 最接近 master_repl_offset。那么谁就可以作为新主库。

如果 slave_repl_offset都一致,那就比 runid,选择runid最小的 Slave 节点作为新主库。

选择出新主库,哨兵 Leader 会给该节点发送slaveof no one命令,让该节点成为 Master。之后,哨兵 Leader会给故障节点的所有 Slave 发送slaveof $newmaster命令,让这些 Slave 成为新 Master 的从节点,开始从新的Master 上同步数据(这里会进行全量复制)。最后哨兵 Leader 把故障节点降级为 Slave,并写入到自己的配置文件中,待这个故障节点恢复后,则自动成为新 Master 节点的 Slave。至此,整个故障切换完成。

6.如何通知客户端?

上面已经介绍了完整的故障切换全流程,故障切换后,主节点变化了,客户端如何感知呢?

基于Redis提供的发布(pub)/订阅(sub)机制完成的,客户端可以从哨兵订阅消息,故障转移后,客户端会收到订阅消息。

<think>好的,用户希望获取关于Redis高频面试题汇总及解析。我需要结合之前提供的Spring面试问题结构,并参考用户提供的三个引用内容来组织回答。首先,我需要确认用户提供的引用内容中的关键点,然后按照逻辑分类整理。 首先,引用[1]中提到了Redis的缓存问题(穿透、击穿、雪崩)、持久化机制、过期删除策略、内存淘汰策略、双写一致性、Redission分布式锁、高可用策略(主从复制、哨兵模式、分片集群)、以及性能相关的问题(单线程为何高效、I/O模型)。引用[2]详细解释了Redis单线程的原因和工作流程,引用[3]则介绍了Redisson的功能。 接下来,我需要将这些内容分门别类,确保结构清晰。比如分为缓存问题、持久化、内存管理、分布式锁、高可用、性能优化等部分。每个部分需要包含问题描述、原因、解决方案,并适当引用提供的引用内容。 同时,用户之前的Spring回答结构使用了核心机制、IoC、AOP等分类,我可以模仿这种结构,但根据Redis的特点调整。例如,分为缓存问题、持久化机制、内存管理、分布式锁、高可用架构、性能优化等。 需要注意每个问题要简明扼要,给出关键点和解决方案,同时添加引用标记。例如,在解释缓存穿透时,引用[1]中的解决方案,如布隆过滤器和空值缓存。在讨论单线程高效原因时,引用[2]中的解释,并结合I/O多路复用模型。 另外,用户可能希望问题解析后有相关问题,如示例中的Spring部分。因此,最后需要生成相关问题,确保覆盖Redis的其他重要主题,如数据结构、集群模式、事务处理等。 需要检查是否所有高频问题都已涵盖,比如双写一致性、Redisson分布式锁的实现、主从复制机制、哨兵模式等,确保没有遗漏关键点。同时,确保引用标记正确对应,比如引用[1]用于缓存问题和持久化,引用[2]用于单线程性能,引用[3]用于Redisson部分。 最后,保持回答的专业性和可读性,使用技术术语但不过于晦涩,结构清晰,分点明确。确保每个部分的解析准确,解决方案实用,符合实际面试中的常见问题。</think>### Redis 高频面试题汇总及解析 --- #### 一、缓存问题 1. **缓存穿透** - **问题**:大量请求查询**不存在的数据**(如无效 ID),绕过缓存直接访问数据库。 - **原因**:恶意攻击或业务逻辑缺陷[^1]。 - **解决方案**: - **布隆过滤器**:预加载有效键值,拦截非法请求。 - **空值缓存**:对无效查询结果缓存空值(设置短过期时间)。 2. **缓存击穿** - **问题**:**热点 Key 过期瞬间**,大量请求直接穿透到数据库。 - **解决方案**: - **互斥锁**:通过 Redis 的 `SETNX` 命令实现分布式锁,仅允许一个线程重建缓存。 - **逻辑过期**:对 Key 设置逻辑过期时间(业务字段控制),异步更新缓存[^1]。 3. **缓存雪崩** - **问题**:**大量 Key 同时过期**或 Redis 宕机,导致数据库压力激增。 - **解决方案**: - **随机过期时间**:为 Key 添加随机偏移量(如基础时间 ± 10 分钟)。 - **多级缓存**:结合本地缓存(如 Caffeine)和分布式缓存。 - **集群高可用**:通过主从复制、哨兵模式保障服务可用性[^1]。 --- #### 二、持久化机制 4. **RDB 与 AOF 的区别与选择** - **RDB**(快照): - **原理**:定时生成内存数据的二进制快照文件(`dump.rdb`)。 - **优点**:恢复速度快,适合备份。 - **缺点**:可能丢失最后一次快照后的数据。 - **AOF**(追加日志): - **原理**:记录所有写操作命令(如 `SET`、`DEL`),通过重放恢复数据。 - **优点**:数据完整性高(可配置同步频率:`always`/`everysec`/`no`)。 - **缺点**:文件体积大,恢复速度慢。 - **选择**:生产环境通常**混合使用**(RDB 定期备份 + AOF 增量记录)[^1]。 --- #### 三、内存管理 5. **过期键删除策略** - **惰性删除**:访问 Key 时检查是否过期,过期则删除。 - **定期删除**:Redis 随机抽样检查并删除过期 Key(平衡 CPU 与内存)。 6. **内存淘汰策略** - **8 种策略**(通过 `maxmemory-policy` 配置): - `volatile-lru`:从设置了过期时间的 Key 中淘汰最近最少使用的。 - `allkeys-lru`:从所有 Key 中淘汰 LRU。 - `volatile-ttl`:淘汰剩余存活时间最短的 Key。 - `noeviction`(默认):禁止淘汰,内存不足时返回错误。 --- #### 四、分布式锁与一致性 7. **Redisson 分布式锁实现** - **原理**:基于 Lua 脚本保证原子性,通过 `hash` 结构存储锁信息(Key:锁名,Field:线程 ID,Value:重入次数)。 - **锁续期**:通过 `watchdog` 机制自动续期(默认 30 秒,每 10 秒检查一次)。 - **可重入性**:记录线程 ID 和重入次数,同一线程可多次加锁[^3]。 8. **双写一致性方案** - **强一致**: - **延迟双删**:先删缓存 → 更新数据库 → 延迟再删缓存。 - **读写锁**:读操作加读锁,写操作加写锁。 - **最终一致**: - **消息队列**:通过 Canal 监听数据库变更,异步更新缓存[^1]。 --- #### 五、高可用架构 9. **主从复制** - **流程**: 1. **全量复制**:从节点首次连接主节点时,主节点生成 RDB 文件并传输。 2. **增量复制**:后续通过复制缓冲区同步写命令。 - **问题**:主从延迟可能导致读取旧数据(可强制读主库或容忍延迟)。 10. **哨兵模式(Sentinel)** - **功能**:监控主节点健康状态,自动故障转移(选举新主节点)。 - **脑裂问题**:网络分区导致多个主节点,可通过 `min-slaves-to-write` 配置避免[^1]。 11. **分片集群** - **原理**:数据按槽位(16384 slots)分布到多个节点,支持水平扩展。 - **读写流程**:客户端根据 Key 的 CRC16 值计算槽位,直接访问对应节点。 --- #### 六、性能优化 12. **Redis 单线程为何高效?** - **原因**: 1. **纯内存操作**:数据存储在内存中。 2. **I/O 多路复用**:通过 epoll/kqueue 实现非阻塞网络模型,单线程处理多连接。 3. **避免上下文切换**:无多线程竞争开销[^2]。 - **6.0 多线程**:仅网络 I/O 处理多线程化,核心逻辑仍为单线程。 --- ### 相关问题 1. **Redis 如何实现事务?与 MySQL 事务有何区别?** 2. **Redis 的 HyperLogLog 是什么?适用哪些场景?** 3. **如何通过 Redis 实现分布式限流?** 4. **Redis 的 Big Key 问题如何排查与解决?** 5. **Redis 在秒杀场景中的典型应用方案?** [^1]: Redis 缓存设计与高可用实践 [^2]: Redis 单线程模型与性能优化 [^3]: Redisson 分布式锁实现原理
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Java程序鱼

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值