Kafka的副本复制策略

最新推荐文章于 2025-06-22 22:00:47 发布

原创最新推荐文章于 2025-06-22 22:00:47 发布 · 2.8k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#分布式 #副本 #可用性 #可靠性 #ISR

分布式同时被 2 个专栏收录

16 篇文章

订阅专栏

12 篇文章

订阅专栏

Kafka会把topic partitions的数据复制到一组server上，当一个Server宕机时可以做自动的故障恢复（automatic failover）。实际是把日志复制到一组机器上，一种基于日志的复制状态机（这里就不讨论这个）。

Kafka的每个topic portition的都会有一个leader，并且有0~n个follower。每个follower都会像一个普通的consumer一样，从leader消费上的message，也就是从leader上拉取message，并且把拉取到的message写入到自己的日志中，写入自己的日志后会（ack）通知leader写入成功。

当Producer向leader写入一条新的message时，一般是不会等follower的通知就返回，并且认为写入成功了。这时这条消息可能还没有被任何的follow拉取并且写入到自己的log中。如果这是leader宕掉的话，这条message就会丢失。

Producer有一个acks的选项，可以让producer等待收到follower后ack再认为是写入成功。收到follower的ack的message是committed的message。

那这里就会出现一个问题，producer收到多少个ack才能认为这条message是committed，也就是写入成功了那？Kafka用一种叫做ISR的策略来确定等待多少个ack。

满足以下2个条件的leader和follower被认为处于一种叫做’in sync’的状态：
1. 与zookeeper保持会话session
2. 如果是follower，它在从leader上复制message，并且没有落下太多（参数制定）。

Leader会记录具有’in sync’状态的所有节点的集合，当某个节点不满足上面的条件时，leader会把从集合中去除。

当所有in sync的副本已经把一条message写入到自己的log里，那么这条message就被认为是committed。

以上就是ISR副本复制策略，还是比较简单的，下面我们分析一下Kafka的可用性、数据可靠性。

显而易见，如果某个partition有f+1个副本，那么是可以容忍f个副本宕机的，并且保证数据是可靠不会丢的。

但是因为in sync集合是动态决定的，那有可能出现，集合中只有leader一个节点，其他的节点都已被移出集合，如果这时，便便Leader宕掉了，那么这种情况下数据是可能丢失的。

所以Kafka有一个参数配置可以指定集合中节点的最小数量，这可以保证即时f个副本宕机，数据也不会丢失，但是集合中的节点数如果小于最小阈值，则这个partition就不可用了。

博客等级

码龄23年

35
原创

24
点赞

61
收藏

82
粉丝

关注

私信

热门文章

分类专栏

Android
并发 6篇
消息队列 4篇
分布式 16篇
rabbitmq 2篇
存储 12篇

展开全部收起

上一篇：: Paxos分析之一—Paxos是什么

下一篇：: Cassandra的副本策略

最新评论

Zookeeper实现分布式锁和选主
q296281594: 如果在客户端在watch之前，获取锁的节点释放了锁，这个是不是就死锁了
如何理解Zookeeper的顺序一致性
q296281594: 小例子那个，为什么不可以顺序进入这两个critical section process 1先运行，可以进入，此时a=0；process2在运行，也可以进入
如何理解Zookeeper的顺序一致性
cadem: 是的，这种"时空回溯"的场景是违反顺序一致性。但是，的确zk是有机制来避免这忠场景，zk客户端新建链接会把之前处理的最大事物zxid带上，新链接的服务端会判断如果zxid大于本服务的最大zxid会拒绝客户端。也就是说，在这种场景下，客户端是连不上followerB的，客户端会连接其他服务器，或者是等到followerB追齐之后，客户端才能重新连接上来。
如何理解Zookeeper的顺序一致性
weixin_38124814: 或则说是有一些机制来避免这种“时空回溯”，例如客户端由A切到B后，会先等待B追上进度（例如类似sync），然后再提供服务？
如何理解Zookeeper的顺序一致性
weixin_38124814: 如果客户端一开始连接的是followerA；然后followerA宕机了，客户端又改连连followerB。而刚好followerB的数据比followerA的数据要延迟一些，这种情况下客户端读到的数据就可能有“时空回溯”。这还算是顺序一致性吗？

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。