从kafka的请求处理模型理解Reactor模式

最新推荐文章于 2025-07-26 11:55:39 发布

Kindle_code

最新推荐文章于 2025-07-26 11:55:39 发布

阅读量838

点赞数

CC 4.0 BY-SA版权

分类专栏：分布式文章标签： kafka 分布式网络

本文链接：https://blog.youkuaiyun.com/Kindle_code/article/details/107966490

分布式专栏收录该内容

4 篇文章

订阅专栏

本文深入探讨了Kafka请求处理的全过程，解析了Reactor模式如何优化请求处理效率，介绍了Broker端的网络线程池与IO线程池分工合作机制，以及Purgatory组件在处理延迟请求中的作用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

内容总结于课程: kafka请求是怎么被处理的

扩展阅读: Scalable IO in Java

简介

Kafka 自己定义了一组请求协议，用于实现各种各样的交互操作。比如常见的 PRODUCE 请求是用于生产消息的，FETCH 请求是用于消费消息的，METADATA 请求是用于请求 Kafka 集群元数据信息的。所有的请求都是通过 TCP 网络以 Socket 的方式进行通讯的。

今天主要整理一下kafka Broker 端处理请求的全流程

关于处理请求，很容易想到的两个方案:

1、单线程处理请求: 由于单线程，吞吐量极差，
2、线程池处理请求: 确实优化了很多，但是每一个线程的粒度太大，处理了连接、处理、返回等操作。
3、Reactor模式: Reactor 模式是事件驱动架构的一种实现方式，特别适合应用于处理多个客户端并发向服务器端发送请求的场景。
在这里插入图片描述
client: 客户端，多个客户端会发送请求给到 Reactor
dispatch(acceptor): Reactor 有个请求分发线程 Dispatcher，也就是图中的 Acceptor，它会将不同的请求下发到多个工作线程中处理。Acceptor 线程只是用于请求分发，不涉及具体的逻辑处理，非常得轻量级，因此有很高的吞吐量表现。而这些工作线程可以根据实际业务处理需要任意增减，从而动态调节系统负载能力。

对比到kafka中的模型图:

在这里插入图片描述
Broker端有ScoketServer组件，类似于 Reactor 模式中的 Dispatcher，也有对应的 Acceptor 线程和一个工作线程池，只不过在 Kafka 中，这个工作线程池有个专属的名字，叫网络线程池。Kafka 提供了 Broker 端参数 num.network.threads，用于调整该网络线程池的线程数。其默认值是 3，表示每台 Broker 启动时会创建 3 个网络线程，专门处理客户端发送的请求。

Acceptor线程采用轮询方式将请求公平分发到所有网络线程，防止请求处理的倾斜。

网络线程池处理请求

在这里插入图片描述
网络线程将进来的请求放入到一个共享请求队列中。Broker 端还有个 IO 线程池，负责从该队列中取出请求，执行真正的处理。如果是 PRODUCE 生产消息请求，则将消息写入到底层的磁盘日志中；如果是 FETCH 请求，则从磁盘或页缓存中读取消息。

IO线程处理的才是真正处理的逻辑。Broker通过参数num.io.threads加粗样式控制了这个线程池中的线程数。目前该参数默认值是 8，表示每台 Broker 启动后自动创建 8 个 IO 线程处理请求。

Purgatory组件: 用来缓存延迟请求，一些未满足条件不能立即执行的请求。比如设置acks=all的produce请求，需要等待收到ISR中所有的副本都持久化消息后才将请求返回，此时处理该请求的IO线程必须等待其他Broker的写入。

kafka请求分类

PRODUCE 和 FETCH 这类请求称为数据类请求
负责更新 Leader 副本、Follower 副本以及 ISR 集合的 LeaderAndIsr 请求，负责勒令副本下线的 StopReplica 请求等为控制类请求

思考，不同类型的请求，是否需要分开处理呢?

问题:

假设我们有个主题只有 1 个分区，该分区配置了两个副本，其中 Leader 副本保存在 Broker 0 上，Follower 副本保存在 Broker 1 上。假设 Broker 0 这台机器积压了很多的 PRODUCE 请求，此时你如果使用 Kafka 命令强制将该主题分区的 Leader、Follower 角色互换，那么 Kafka 内部的控制器组件（Controller）会发送 LeaderAndIsr 请求给 Broker 0，显式地告诉它，当前它不再是 Leader，而是 Follower 了，而 Broker 1 上的 Follower 副本因为被选为新的 Leader，因此停止向 Broker 0 拉取消息。
这时，一个尴尬的场面就出现了：如果刚才积压的 PRODUCE 请求都设置了 acks=all，那么这些在 LeaderAndIsr 发送之前的请求就都无法正常完成了。就像前面说的，它们会被暂存在 Purgatory 中不断重试，直到最终请求超时返回给客户端。