Kafka如何保证数据的可靠性和一致性

最新推荐文章于 2024-02-18 09:55:46 发布

原创

最新推荐文章于 2024-02-18 09:55:46 发布 · 3.9k 阅读

·

14

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#kafka #消息队列

本文深入探讨了Kafka如何确保数据的可靠性和一致性。通过使用分区副本和ISR列表，Kafka能够在Leader副本故障时无缝切换，保持服务连续性。Producer的acks配置（如acks=all）和同步发送模式有助于保证消息不丢失。此外，通过选举ISR中的follower为新Leader，确保数据已提交。同时，介绍了HW和LEO的概念，解释了在follower和leader故障时如何保持数据一致性。为实现高可靠性，建议配置包括producer.acks、replication.factor、min.insync.replicas及unclean.leader.election.enable等相关参数。

Kafka如何保证数据的可靠性和一致性

1 数据可靠性
- 1.1 Topic 分区副本

Kafka 可以保证单个分区里的事件是有序的，分区可以在线（可用），也可以离线（不可用）。在众多的分区副本里面有一个副本是 Leader，其余的副本是 follower，所有的读写操作都是经过 Leader 进行的，同时 follower 会定期地去 leader 上的复制数据。当 Leader 挂了的时候，其中一个 follower 会重新成为新的 Leader。通过分区副本，引入了数据冗余，同时也提供了 Kafka 的数据可靠性。

Kafka 的分区多副本架构是 Kafka 可靠性保证的核心，把消息写入多个副本可以使 Kafka 在发生崩溃时仍能保证消息的持久性。

1.2 Producer 往 Broker 发送消息

Kafka 在 Producer 里面提供了消息确认机制。也就是说我们可以通过配置来决定消息发送到对应分区的几个副本才算消息发送成功。

对于某些不太重要的数据，对某些数据的可靠性要求不是很高，能够容忍数据的少量丢失，所以没必要等待ISR中的follower全部接受成功；

kafka为用户设置了三种可靠性级别，通过acks参数设定：

0： producer不等broker的ack,

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。