kafka 一对多消费模式中数据的存储情况介绍

原创于 2025-09-15 13:35:58 发布 · 442 阅读

·

4

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#kafka #分布式

kafka 必知必会专栏收录该内容

13 篇文章

订阅专栏

在 Kafka 的 一对多消费模型（即 发布-订阅模式）中，数据在 Kafka 中的存储方式如下：

1. 数据存储的份数

每条消息在 Kafka 中只存储一份，无论有多少个消费者组订阅该 Topic。
Kafka 的分区（Partition）是消息存储的基本单元。消息写入时，会根据分区规则（如 Key 的哈希值或轮询）分配到某个分区的 Log 文件中。每个分区的消息只存储一份，但多个消费者组可以同时订阅该分区的消息。

2. 消费者组与数据消费

消费者组（Consumer Group） 是 Kafka 实现一对多消费的核心机制。不同消费者组可以独立消费同一个 Topic 的消息：
- 每个消费者组维护自己的 消费偏移量（Offset），记录已消费的位置。
- 即使多个消费者组订阅同一个 Topic，消息本身不会被复制多次，而是通过 Offset 机制实现多个消费者组的独立消费。

3. 数据保留时间

Kafka 会根据配置的 消息保留策略（如 log.retention.hours）保留消息。只要消息未过期，所有订阅的消费者组都可以消费到这些消息。
如果消息过期或被删除，所有消费者组将无法再消费该消息。

4. 一对多消费的实现原理

发布-订阅模式：生产者将消息发送到 Topic，多个消费者组订阅该 Topic。每个消费者组独立消费消息，互不影响。
分区与副本：每个 Topic 的分区在 Kafka 集群中可能有多个副本（Leader 和 Follower），但这些副本是用于高可用性和容错，而不是为了支持一对多消费。消息在分区中只存储一份，副本之间通过同步保持数据一致性。

5. 示例场景

假设有一个 Topic orders，包含 2 个分区（Partition 0 和 Partition 1）。
有两个消费者组 groupA 和 groupB，分别订阅 orders。
生产者发送消息到 orders，消息会被分配到 Partition 0 或 Partition 1。
groupA 和 groupB 的消费者会分别从各自的 Offset 位置拉取 Partition 0 和 Partition 1 中的消息。
消息在 Kafka 中仅存储一份，但 groupA 和 groupB 可以独立消费同一份数据。

总结

数据存储份数：Kafka 中的每条消息在分区中只存储一份，即使有多个消费者组订阅。
消费者组独立消费：通过 Offset 机制，不同消费者组可以独立消费同一份数据，无需复制存储。
高效率：这种设计避免了冗余存储，同时支持一对多消费的灵活性。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。