SyncRequestProcessor 小代码大优雅

最新推荐文章于 2023-02-19 19:14:29 发布

已转行此号停用

最新推荐文章于 2023-02-19 19:14:29 发布

阅读量331

点赞数

分类专栏：个人技术分享

个人技术分享专栏收录该内容

1402 篇文章

订阅专栏

本文深入剖析 ZooKeeper 的 SyncRequestProcessor 处理器，揭示其如何通过持久化机制确保消息可靠性，同时探讨其背后的优化策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

　　引言

　　zookeeper 的业务处理流程就像工作流一样，其实就是一个单链表;在zookeeper启动的时候，会确立各个节点的角色特性，即leader、follower和observer，每个角色确立后，就会初始化它的工作责任链;

图片描述

　　本篇要分享的是 zookeeper的源码分析之SyncRequestProcessor处理器，其目的是进行持久化，也就是将消息存储到磁盘文件中;代码不多，但有不少值得借鉴的地方;

　　主要成员变量

　　queuedRequests：

　　在zookeeper中各个工作责任链之间进行消息通信的是通过LinkedBlockingQueue 来进行线程间信息交互的;queuedRequests就是SyncRequestProcessor和上一责任链之间进行消息交互的队列;

　　toFlush ：

　　待flush到磁盘的事务日志消息容器，包括增、删、改消息，查询类消息不进入该容器;

　　snapCount：

　　生成snapshot的事务记录参数值，可在zoo.cfg中进行配置，即事务日志记录数大于等于snapCount(其具体算法在下面进行探讨，这里先这样记录)的时候，进行snapshot文件的生成;

　　randRoll：

　　生成snapshot的随机值，和snapcount配合使用;

　　业务处理

　　由于SyncRequestProcessor是继承自ZooKeeperThread，所以它的主要逻辑是在run函数中，直接进入run函数中;

　　zookeeper没有直接采用queuedRequests.take()进行消息接收，而是采用了两种方式take()和poll();take函数会等待直至消息的到来;而poll()则是如果没有消息，就会立即返回null;

　　zookeeper为什么这样设计，先抛个问题，我们先看下面的逻辑，然后再回答这个问题;

　　代码三

　　if (si != null)

　　if (LOG.isDebugEnabled()) {

　　LOG.debug({},si);

　　LOG.debug(toFlush .size = + toFlush.size());

　　}

　　// track the number of records written to the log

　　if (zks.getZKDatabase().append(si)) {

　　logCount++;

　　if (logCount (snapCount / 2 + randRoll)) {

　　setRandRoll(r.nextInt(snapCount/2));

　　// roll the log

　　zks.getZKDatabase().rollLog();

　　// take a snapshot

　　if (snapInProcess != null snapInProcess.isAlive()) {

　　LOG.warn(Too busy to snap, skipping);

　　} else {

　　snapInProcess = new ZooKeeperThread(Snapshot Thread) {

　　public void run() {

　　try {

　　zks.takeSnapshot();

　　} catch(Exception e) {

　　LOG.warn(Unexpected exception, e);

　　}

　　};

　　snapInProcess.start();

　　}

　　logCount = 0;

　　}

　　} else if (toFlush.isEmpty()) {

　　// optimization for read heavy workloads

　　// iff this is a read, and there are no pending

　　// flushes (writes), then just pass this to the next

　　// processor

　　if (nextProcessor != null) {

　　nextProcessor.processRequest(si);

　　if (nextProcessor instanceof Flushable) {

　　((Flushable)nextProcessor).flush();

　　}

　　continue;

　　}

　　toFlush.add(si);

　　if (toFlush.size() 1000) {

　　flush(toFlush);

　　}

　　zookeeper的两种持久化方式，一种是进行增量事务日志，一种是snapshot文件;增量事务日志就是将所有的事务操作记录下来;而snapshot文件就是把内存中的数据进行全量备份下来;

　　SyncRequestProcessor 先调用了zks.getZKDatabase().append(si)，该函数是将事务日志

　　记录下来，如果是事务类消息，即增删改，则返回true;如果是查询类消息，就返回false;当返回true的时候，即记录事物日志，这时候做了一个判断 if (logCount (snapCount / 2 + randRoll)) ;SyncRequestProcessor 并没有直接进行logCount 和snapCount 的判断，即logCount snapCount ;而是生成了一个随机数，其目的主要是考虑到在zookeeper集群中，各个节点的内存数据在某一时刻是基本一致的，如果都是进行logCount snapCount ，就生成snapshot，势必导致zookeeper集群中各个节点在某一时刻，都会去进行snapshot，因为磁盘io操作总是相对较慢的，所以会导致节点都忙于刷磁盘文件了，系统负载会增加上去，那么对外的服务就会受到影响;所以这里采用logCount (snapCount / 2 + randRoll)一个随机数和logCount的比较，是一种全局观，有一定的规划思想在里面;

　　那么当zks.getZKDatabase().append(si)返回为false的时候，则判断了toFlush.isEmpty()，其实这也就是非事务消息的逻辑，当该消息是非事务消息，即查询类消息时候，则直接进行nextProcessor的处理，处理完就进行continue;

　　只有事务消息才会进入toFlush，也就是toFlush.add(si)的逻辑;后续有一个flush函数，我们来看flush的函数都做了什么;