Kafka的Consumer相关知识回顾总结

最新推荐文章于 2024-06-12 16:30:26 发布

一心只想搞数据

最新推荐文章于 2024-06-12 16:30:26 发布

阅读量344

点赞数

文章标签： kafka big data 分布式

本文链接：https://blog.youkuaiyun.com/d13012416303/article/details/124776883

版权

Kafka的Consumer相关知识回顾总结

1.消费者组流程（超级详细）

在这里插入图片描述
这里注意一下coordinator（节点的选择 gropuid%50）：辅助实现消费者组的初始化和分区的分配。第一步是poll操作，第四步有range，roundrobin，粘性常用的三个，第7步有两个再平衡（1.消费者与coordinator通讯>45s 。消费者与分区处理消息>5分钟）

在这里插入图片描述
这里注意一下消费者拉取数据的1.最小批次1字节，最大50m。2.一批数据超时时间500ms。3.拉取数据的最大500条数。通过send拉取之后，通过onSuccess返回到消息队列，经过反序列化->拦截器->处理数据到达消费者。

2.按照主题消费

0）配置信息
1.连接
2.反序列化
3.组id
1）创建消费者
2）订阅Topic
3）发送数据

3.按照分区消费

4.消费组案例

5.分区分配策略（再平衡）

例如：7个分区，3个消费者
1.range
分区数%消费者=2…1
每个消费者依次处理两个分区，剩下的一个交给第一个消费者。每次都交给第一个消费者，如果topic多的话，容易产生数据倾斜
0 1 2
3 4
5 6
再平衡：（45s内）如果第一个消费者挂了，则把0 1 2 都给第二个消费者（45s后重启，剩下两个消费者，重新按照range分配）
2.roundrobin（轮询，分配的均匀）
0 3 6
1 4
2 5
再平衡：（45s内）如果第一个消费者挂了，则把0 3 6轮询给第二第三个消费者（45s后重启，剩下两个消费者，重新按照roundrobin分配）
3.粘性（类似于range，但是这个分区是随机的）
再平衡：（45s内）如果第一个消费者挂了，则把0 3 6尽量均匀的分给第二第三个消费者（45s后重启，剩下两个消费者，重新按照粘性分配）