Kafka必备知识点(简单总结)

Kafka必备知识点(简单总结)

在这里插入图片描述

文章目录

1.kafka从生产到消费的流程

在这里插入图片描述
1、Kafka生态系统四大角色,生产者(Producer)、kafka集群(Broker)、消费者(Consumer)、zookeeper
2、每个消费者都必须属于一个消费组,一个组内的消费者可以多个。
3、一个Topic可以有1到多个多个分区(Partition)
4、一个分区可以有1到多个segment。
5、每个segment可以有由一个log和一个index组成。
6、被复制的分区叫做主副本(Leader),复制出来的叫做从副本(Follower)
7、生产者只往主副本写数据,消费者只在主副本拉取数据。
8、从副本只做数据备份,不做数据读写。

【红色字体表示隐藏知识点】
9、一个分区内的一条数据,只能被一个消费组内的一个消费者消费。
10、消费者的最大并发度由topic的分区数量决定
11、分区副本的数量必须小于等于broker的数量
12、一个topic内的多个分区,每个分区只是所有数据的一部分。所有分区的数据累加到一起是这个topic的全部数据。

13、zookeeper中记录了broker的id 、消费者消费数据的offset,消费者与partition的对应关系(ConsumerA—> Partition-0, ConsumerB—> Partition-1)

2、什么是kafka

是一个分布式,分区的,多副本的,多订阅者的消息发布订阅系统。

3、kafka的使用场景

应用耦合、异步处理、限流削峰、消息驱动的系统

4、kafka优缺点

优点:

  • 可靠性强(分布式+分区+副本)
  • 扩展性强(可伸缩)
  • 性能高(数据读写)
  • 耐用性强(数据持久化)、时效性强。

缺点:

  • 由于是批量发送,数据并非真正的实时
  • 仅支持分区内消息有序,无法实现全局消息有序
  • 有可能重复消费
  • 依赖zookeeper进行元数据管理
5、Kafka架构(流程)
  • 生产者
  • kafka集群
  • 消费者
  • zookeeper
6、Kafka架构(API)
  • 生产者
  • 消费者
  • StreamAPI
  • ConnectAPI
7、Topic内部有哪些组成?

每个Topic包含一个或者多个Partition,一个partition当中存在多个segment文件段,每个segment分为两部分,.log文件和.index文件。

8、分区和消费组内的消费者之间的关系有哪些情况?

Partition = 消费任务的并发度=刚刚好,每个任务读取一个partition数据
Partiti

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值