消费方案确定后，Kafka如何拉取消息

最新推荐文章于 2025-05-19 15:23:01 发布

原创最新推荐文章于 2025-05-19 15:23:01 发布 · 511 阅读

·

6

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#kafka #分布式

kafka 专栏收录该内容

1 篇文章

订阅专栏

在消费者被协调者节点coordinator（也是消费者，只是第一个发送加组请求的消费者）分配好消费方案后，如何拉取消息呢？下面我们结合流程图来理解下：

核心思想其实就是：从指定位置（分区偏移量）、指定大小（一次捞取多少）、指定topic分区向broker的主节点发送fetch请求，一次性把一大批的分区数据拉到消费者本地内存，然后按照用户的消费配置（max.poll.records）依次给出响应数据。

下面我们结合流程图逐步分析下（下半部分图）：

先判断是否已经发送过fetch请求，即之前已经从broker捞取数据且缓存有数据，如果没有则进入灰色方块流程，给broker发送fetch请求，核心参数如下。拉取后把分区信息放入本地缓存里。
1. 分区信息：主要是topic和分区
2. minBytes：最小拉取多少个字节
3. maxBytes ：最大拉取多少字节，默认50M
如果fetch过，则每次请求时只从缓存中拿。这个大家应该印象比较深刻，即客户端的map.poll.records配置，比如默认值为500。则本次会调用源码里的pollForFetches，从缓存中取出500个消息，然后在自己的缓存里对本次拉到的偏移量位置打标，方便下次知道从哪个地方消费数据。进去后发现，里面就是按照配置（max.poll.records）从缓存里取数据：completedFetches则是每次给broker发送fetch请求成功后，将数据塞入的结合对象。
将500个偏移量消息成功给到消费者后，缓存里会减掉500个。如此循环，等缓存里没有数据了消费者客户端才会向broker发送fetch请求，如此往返。

注意这里从缓存返回消息后，会给缓存的消息打标（position），以便知道下次循环该从哪个位置开始消费，但是这里的打标并不是提交偏移量。

toby@意外惊喜

博客等级

码龄10年

2
原创

6
点赞

3
收藏

5
粉丝

关注

私信

TA的精选

热 mysql执行计划成本分析和慢查解决方案
1008 阅读

TA的历史创作历程

分类专栏

kafka 1篇

上一篇：: mysql执行计划成本分析和慢查解决方案

目录

展开全部

收起

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。