Kafka的broker、topic、partition、group的关系

kafka消费模式

Kafka的消费模式主要有两种:一种是一对一的消费,也即点对点的通信,即一个发送一个接收。第二种为一对多的消费(发布/订阅模式),即一个消息发送到消息队列,消费者根据消息队列的订阅拉取消息消费。

点对点模式

消息生产者发布消息到Queue队列中,通知消费者从队列中拉取消息进行消费。消息被消费之后则删除,Queue支持多个消费者,但对于一条消息而言,只有一个消费者可以消费,即一条消息只能被一个消费者消费。

发布/订阅模式

发布/订阅模式,即利用Topic存储消息,消息生产者将消息发布到Topic中,同时有多个消费者订阅此topic,消费者可以从中消费消息,注意发布到Topic中的消息会被多个消费者消费,消费者消费数据之后,数据不会被清除,Kafka会默认保留一段时间,然后再删除。

注意:同一消费者组内的消费者共享主题分区,每个分区仅被组内一个消费者消费,实现消息的负载均衡。

kafka基础架构

Kafka像其他Mq一样,也有自己的基础架构,主要存在生产者Producer、Kafka集群Broker、消费者Consumer、注册消息Zookeeper.

  • Producer:消息生产者,向Kafka中发布消息的角色。
  • Consumer:消息消费者,即从Kafka中拉取消息消费的客户端。
  • Consumer Group:消费者组,消费者组则是一组中存在多个消费者,消费者消费Broker中当前Topic的不同分区中的消息,消费者组之间互不影响,所有的消费者都属于某个消费者组,即消费者组是逻辑上的一个订阅者。某一个分区中的消息只能够一个消费者组中的一个消费者所消费
  • Broker:经纪人,一台Kafka服务器就是一个Broker,一个集群由多个Broker组成,一个Broker可以容纳多个Topic。
  • Topic:主题,可以理解为一个队列,生产者和消费者都是面向一个Topic
  • Partition:分区,为了实现扩展性,一个非常大的Topic可以分布到多个Broker上,一个Topic可以分为多个Partition,每个Partition是一个有序的队列(分区有序,不能保证全局有序)
  • Replica:副本Replication,为保证集群中某个节点发生故障,节点上的Partition数据不丢失,Kafka可以正常的工作,Kafka提供了副本机制,一个Topic的每个分区有若干个副本,一个Leader和多个Follower
  • Leader:每个分区多个副本的主角色,生产者发送数据的对象,以及消费者消费数据的对象都是Leader。
  • Follower:每个分区多个副本的从角色,实时的从Leader中同步数据,保持和Leader数据的同步,Leader发生故障的时候,某个Follower会成为新的Leader。

上述一个Topic会产生多个分区Partition,分区中分为Leader和Follower,消息一般发送到Leader,Follower通过数据的同步与Leader保持同步,消费的话也是在Leader中发生消费,如果多个消费者,则分别消费Leader和各个Follower中的消息,当Leader发生故障的时候,某个Follower会成为主节点,此时会对齐消息的偏移量。

个人理解:kafka集群,由多个Broker组成,一个Broker里面可以容纳多个Topic,每个Topic由多个partition组成,多个partition分散存储在多个Broker中,为了实现高可用,每个partition可以存在多个副本(一个Leader和多个Follower),消息生产者发送的消息最终都是先发送在指定topic下的某个Leader partition中,Follower partition会实时的从Leader中同步数据,Leader发生故障的时候,某个Follower会成为新的Leader。

真实项目使用

kafka集群由3个broker组成。可以看到,该topic有4个partition,并且partition的副本数量为2,则总共有8个partition,4个Leader和4个Follower。

并且在主机id为0和1上面,均存储了一个Leader partition,而主机id为3上面存储了2个Leader partition。

在我们项目中,某个服务监听了该topic的消息,并且该服务已配置了自己的消费者组id。

在部署该服务的时候,给这个服务配置了6个实例,即在这个消费者组id下,共有6个消费者,在接收kafka消息时,同一消费者组下只会有一个消费者接收到消息。

### KafkaBroker与分区的关系详解 Kafka 是一个分布式流处理平台,其核心架构组件包括 BrokerTopicPartitionBrokerKafka 集群中的服务器节点,负责存储和管理数据。PartitionTopic 的逻辑分片,用于实现数据的并行处理和高可用性。以下是关于 KafkaBroker 与分区关系的详细解析: #### 1. **Broker 的角色** BrokerKafka 集群的基本单元,每个 Broker 负责存储和管理多个 Partition 的数据。Broker 的主要职责包括: - 存储 Partition 数据。 - 处理 Producer 和 Consumer 的请求。 - 参与 Leader 和 Follower 的选举过程[^3]。 Broker 的数量直接影响集群的扩展性和容错能力。当新增或移除 Broker 时,Kafka 会通过 Zookeeper 自动调整 Partition 的分布以保持负载均衡[^3]。 #### 2. **Partition 的作用** PartitionTopic 的基本存储单元,每个 Partition 是一个有序的日志文件列表。Partition 的主要作用包括: - 提供数据的并行处理能力。 - 实现数据的持久化存储。 - 支持多副本机制以确保高可用性[^1]。 Partition 的数量在创建 Topic 时指定,并且决定了该 Topic 的最大并行度。每个 Partition 只能由一个 Consumer Group 中的一个 Consumer 消费,因此 Partition 的数量也限制了 Consumer Group 的并发消费能力[^1]。 #### 3. **BrokerPartition关系** BrokerPartition关系可以概括为以下几点: - **存储**:每个 Partition 被分配到一个具体的 Broker 上进行存储。Broker 负责维护 Partition 的数据完整性[^3]。 - **Leader 和 Follower**:每个 PartitionKafka 集群中有多个副本(Replica),其中一个副本被选为 Leader,其余为 Follower。只有 Leader 副本可以处理读写请求,Follower 副本从 Leader 同步数据。 - **负载均衡**:Kafka 集群通过 Zookeeper 动态调整 Partition 的分布,确保每个 Broker 的负载均衡[^3]。 - **高可用性**:当某个 Broker 不可用时,Kafka 会重新选举新的 Leader 副本来保证服务的连续性。 #### 4. **Partition 分配策略** Kafka 提供了多种 Partition 分配策略,常用的默认分区器基于 Murmur2 哈希算法,确保消息均匀分布到各个 Partition 上[^2]。如果需要自定义分区策略,可以通过实现 `Partitioner` 接口来定义业务逻辑。 以下是一个简单的自定义 Partitioner 示例代码: ```java public class OrderPartitioner implements Partitioner { @Override public int partition(String topic, Object key, Object value, Cluster cluster) { List<PartitionInfo> partitions = cluster.partitionsForTopic(topic); int numPartitions = partitions.size(); if (key == null) { return ThreadLocalRandom.current().nextInt(numPartitions); } // 根据 Key 的哈希值计算 Partition return Math.abs(key.hashCode()) % numPartitions; } @Override public void close() {} @Override public void configure(Map<String, ?> configs) {} } ``` #### 5. **动态调整 Partition 分布** 当 Broker 上下线时,Zookeeper 会记录相关变化并通知 Kafka Controller 进行调整。例如: - 当某个 Broker 停止时,其上的 Partition Leader 会被重新选举到其他可用 Broker 上[^3]。 - 当 Broker 重新上线时,Kafka 会将部分 Partition 分配回该 Broker,以恢复负载均衡。 以下是模拟 Broker 上下线的 Zookeeper 数据变化示例: - 初始状态:`ls /kafka/brokers/ids [0, 1, 2]` - Broker 2 下线后:`ls /kafka/brokers/ids [0, 1]` - Broker 2 上线后:`ls /kafka/brokers/ids [0, 1, 2]` #### 6. **页缓存对性能的影响** Kafka 利用操作系统级别的页缓存(Page Cache)优化读写性能。由于 Partition 数据是顺序写入磁盘的,因此页缓存能够显著提升 Kafka 的吞吐量[^4]。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值