java.util.concurrent 包源码分析之Fork/Join框架

最新推荐文章于 2025-05-30 21:49:24 发布

Kuzury

最新推荐文章于 2025-05-30 21:49:24 发布

阅读量1.2k

点赞数

CC 4.0 BY-SA版权

分类专栏： JAVA 文章标签： Fork Join

本文链接：https://blog.youkuaiyun.com/u010039929/article/details/62044381

JAVA 专栏收录该内容

34 篇文章

订阅专栏

本文详细分析了Java 7引入的Fork/Join框架，它采用分治策略，通过Fork分解任务，Join合并结果。关键类包括ForkJoinTask及其子类RecursiveAction和RecursiveTask，以及ForkJoinPool。工作线程ForkJoinWorkerThread使用双端队列和工作窃取算法提高并发性能。ForkJoinTask的fork和join方法是核心，join方法涉及多线程间的同步等待。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在JDK7引入了Fork/Join框架，所谓Fork/Join框架，个人理解，有一种分治的策略在里边：Fork分解任务成独立的子任务，用多线程去执行这些子任务，Join合并子任务的结果。这样就能使用多线程的方式来执行一个任务。

JDK7引入的Fork/Join有三个核心类：

ForkJoinPool，执行任务的线程池

ForkJoinWorkerThread，执行任务的工作线程

ForkJoinTask，一个用于ForkJoinPool的任务抽象类。

我们已经很清楚Fork/Join框架的需求了，那么我们可以思考一下，如果让我们来设计一个Fork/Join框架，该如何设计？这个思考有助于你理解Fork/Join框架的设计。

第一步分割任务。首先我们需要有一个fork类来把大任务分割成子任务，有可能子任务还是很大，所以还需要不停的分割，直到分割出的子任务足够小。

第二步执行任务并合并结果。分割的子任务分别放在双端队列里，然后几个启动线程分别从双端队列里获取任务执行。子任务执行完的结果都统一放在一个队列里，启动一个线程从队列里拿数据，然后合并这些数据。

Fork/Join使用两个类来完成以上两件事情：

ForkJoinTask：我们要使用ForkJoin框架，必须首先创建一个ForkJoin任务。它提供在任务中执行fork()和join()操作的机制，通常情况下我们不需要直接继承ForkJoinTask类，而只需要继承它的子类，Fork/Join框架提供了以下两个子类：

    RecursiveAction：用于没有返回结果的任务。
    RecursiveTask ：用于有返回结果的任务。

ForkJoinPool ：ForkJoinTask需要通过ForkJoinPool来执行，任务分割出的子任务会添加到当前工作线程所维护的双端队列中，进入队列的头部。当一个工作线程的队列里暂时没有任务时，它会随机从其他工作线程的队列的尾部获取一个任务。

    public class Calculator extends RecursiveTask<Integer> {  

        private static final int THRESHOLD = 100;  
        private int start;  
        private int end;  

        public Calculator(int start, int end) {  
            this.start = start;  
            this.end = end;  
        }  

        @Override  
        protected Integer compute() {  
            int sum = 0;  
            if((start - end) < THRESHOLD){  
                for(int i = start; i< end;i++){  
                    sum += i;  
                }  
            }else{  
                int middle = (start + end) /2;  
                Calculator left = new Calculator(start, middle);  
                Calculator right = new Calculator(middle + 1, end);  
                left.fork();  
                right.fork();  

                sum = left.join() + right.join();  
            }  
            return sum;  
        }  

    }

而执行该自定义任务的调用的则是ForkJoinPool的execute方法，因此首先来看的就是ForkJoinPool的execute方法，看看和普通线程池执行任务有什么不同：

  public void execute(ForkJoinTask<?> task) {
        if (task == null)
            throw new NullPointerException();
        forkOrSubmit(task);
    }

因此forkOrSubmit是真正执行ForkJoinTask的方法：

   private <T> void forkOrSubmit(ForkJoinTask<T> task) {
        ForkJoinWorkerThread w;
        Thread t = Thread.currentThread();
        if (shutdown)
            throw new RejectedExecutionException();
        if ((t instanceof ForkJoinWorkerThread) &&
            (w = (ForkJoinWorkerThread)t).pool == this)
            w.pushTask(task);
        else
            // 正常执行的时候是主线程调用的，因此关注addSubmission
            addSubmission(task);
    }

那么我们首先要关注的是addSubmission方法，发觉所做的事情和普通线程池很类似，就是把任务加入到队列中，不同的是直接使用Unsafe操作内存来添加任务对象

   private void addSubmission(ForkJoinTask<?> t) {
        final ReentrantLock lock = this.submissionLock;
        lock.lock();
        try {
            // 队列只是普通的数组而不是普通线程池的BlockingQueue，
            // 唤醒worker线程的工作由下面的signalWork来完成
            // 使用Unsafe进行内存操作，把任务放置在数组中
            ForkJoinTask<?>[] q; int s, m;
            if ((q = submissionQueue) != null) {
                long u = (((s = queueTop) & (m = q.length-1)) << ASHIFT)+ABASE;
                UNSAFE.putOrderedObject(q, u, t);
                queueTop = s + 1;
                if (s - queueBase == m)
                    // 数组已满，为数组扩容
                    growSubmissionQueue();
            }
        } finally {
            lock.unlock();
        }
        // 通知有新任务来了：两种操作，有空闲线程则唤醒该线程
        // 否则如果可以新建worker线程则为这个任务新建worker线程
        // 如果不可以就返回了，等到有空闲线程来执行这个任务
        signalWork();
    }

接下来要弄清楚就是在compute中fork时，按道理来说这个动作是和主任务在同一个线程中执行，fork是如果把子任务变成多线程执行的：

    public final ForkJoinTask<V> fork() {
        ((ForkJoinWorkerThread) Thread.currentThread())
            .pushTask(this);
        return this;
    }

在上面分析forkOrSubmit的时候同样见到了ForkJoinWorkerThread的pushTask方法调用，那么来看这个方法：

   final void pushTask(ForkJoinTask<?> t) {
        // 代码的基本逻辑和ForkJoinPool的addSubmission方法基本一致
        // 都是把任务加入了任务队列中，这里是加入到ForkJoinWorkerThread
        // 内置的任务队列中
        ForkJoinTask<?>[] q; int s, m;
        if ((q = queue) != null) {    // ignore if queue removed
            long u = (((s = queueTop) & (m = q.length - 1)) << ASHIFT) + ABASE;
            UNSAFE.putOrderedObject(q, u, t);
            queueTop = s + 1;         // or use putOrderedInt
            // 这里不太明白
            if ((s -= queueBase) <= 2)
                pool.signalWork();
            else if (s == m)
                growQueue();
        }
    }

ForkJoinWorkerThread的run方法：

   public void run() {
        Throwable exception = null;
        try {
            // 初始化任务队列
            onStart();
            // 线程运行
            pool.work(this);
        } catch (Throwable ex) {
            exception = ex;
        } finally {
            // 结束后的工作
            onTermination(exception);
        }
    }

因此我们需要再次回到ForkJoinPool，看看work方法：

 final void work(ForkJoinWorkerThread w) {
        boolean swept = false;                // 下面scan方法没有扫描到任务返回true
        long c;
        // ctl是一个64位长的数据，它的格式如下：
        // 48-63：AC，正在运行的worker线程数减去系统的并发数（减去系统的并发得出的实际是在某一瞬间等待并发资源的线程数量）
        // 32-47：TC，所有的worker线程数减去系统的并发数
        // 31：   ST，1表示线程池正在关闭
        // 16-30：EC，第一个等待线程的等待数
        // 0- 15：ID，Treiber栈（存储等待线程）顶的worker线程在线程池的线程队列中的索引
        // (int)(c = ctl) >= 0表示ST位为0，即线程池不是正在关闭的状态
        while (!w.terminate && (int)(c = ctl) >= 0) {
            int a; // 正在运行的worker线程数，ctl中的AC部分
            // swept为false可能有三种：
            // 1. scan返回false
            // 2. 首次循环
            // 3. tryAwaitWork成功
            if (!swept && (a = (int)(c >> AC_SHIFT)) <= 0)
                swept = scan(w, a);
            else if (tryAwaitWork(w, c))
                swept = false;
        }
    }

  private boolean scan(ForkJoinWorkerThread w, int a) {
        int g = scanGuard; // mask 0 avoids useless scans if only one active
        int m = (parallelism == 1 - a && blockedCount == 0) ? 0 : g & SMASK;
        ForkJoinWorkerThread[] ws = workers;
        if (ws == null || ws.length <= m)         // staleness check
            return false;
        // 代码看起来晕啊，看来当前的ForkJoinWorkerThread不一定是运行自己的
        // Task，可以运行其他ForkJoinWorkerThread的Task。
        // 似乎有点明白了，这样可以实现Fork出来的任务被多线程执行
        // 看起来这是一个较为复杂的算法
        for (int r = w.seed, k = r, j = -(m + m); j <= m + m; ++j) {
            ForkJoinTask<?> t; ForkJoinTask<?>[] q; int b, i;
            ForkJoinWorkerThread v = ws[k & m];
            if (v != null && (b = v.queueBase) != v.queueTop &&
                (q = v.queue) != null && (i = (q.length - 1) & b) >= 0) {
                long u = (i << ASHIFT) + ABASE;
                if ((t = q[i]) != null && v.queueBase == b &&
                    UNSAFE.compareAndSwapObject(q, u, t, null)) {
                    int d = (v.queueBase = b + 1) - v.queueTop;
                    v.stealHint = w.poolIndex;
                    if (d != 0)
                        signalWork();             // propagate if nonempty
                    w.execTask(t);
                }
                r ^= r << 13; r ^= r >>> 17; w.seed = r ^ (r << 5);
                return false;                     // store next seed
            }
            else if (j < 0) {                     // xorshift
                r ^= r << 13; r ^= r >>> 17; k = r ^= r << 5;
            }
            else
                ++k;
        }
        if (scanGuard != g)                       // staleness check
            return false;
        else {                                    // try to take submission
            ForkJoinTask<?> t; ForkJoinTask<?>[] q; int b, i;
            if ((b = queueBase) != queueTop &&
                (q = submissionQueue) != null &&
                (i = (q.length - 1) & b) >= 0) {
                long u = (i << ASHIFT) + ABASE;
                if ((t = q[i]) != null && queueBase == b &&
                    UNSAFE.compareAndSwapObject(q, u, t, null)) {
                    queueBase = b + 1;
                    w.execTask(t);
                }
                return false;
            }
            return true;                         // all queues empty
        }
    }

Work-Stealing的部分，下面列出该算法的要点：

每个Worker线程都维护一个任务队列，即ForkJoinWorkerThread中的任务队列。
任务队列是双向队列，这样可以同时实现LIFO和FIFO。
子任务会被加入到原先任务所在Worker线程的任务队列。
Worker线程用LIFO的方法取出任务，也就后进队列的任务先取出来（子任务总是后加入队列，但是需要先执行）。
Worker线程的任务队列为空，会随机从其他的线程的任务队列中拿走一个任务执行（所谓偷任务：steal work，FIFO的方式）。
如果一个Worker线程遇到了join操作，而这时候正在处理其他任务，会等到这个任务结束。否则直接返回。
如果一个Worker线程偷任务失败，它会用yield或者sleep之类的方法休息一会儿，再尝试偷任务（如果所有线程都是空闲状态，即没有任务运行，那么该线程也会进入阻塞状态等待新任务的到来）。

那么重新回到ForkJoinPool的scan方法

private boolean scan(ForkJoinWorkerThread w, int a) {
        // scanGuard是32位的整数，用于worker线程数组的索引
        // 第16位称为SG_UNIT，为1表示锁住
        // 0到15位是mask
        int g = scanGuard;
        // parallelism表示并发数，一般指CPU可以同时运行的线程数
        // 默认值是Runtime类的availableProcessors方法返回值，表示
        // 处理器的数量
        // a是活跃的Worker线程的数量，parallelism是大于0的，因此
        // 条件parallelism == 1 - a满足意味着parallelism为1而a为0
        // 而加上blockedCount为0（意味着没有线程因为join被阻塞），
        // 两个条件同时满足也就意味既没有任何线程在运行，那么也就
        // 意味着没有任务存在于worker线程，所以m=0也就是没法偷任务
        // SMASK=0xffff，g & SMASK返回的值scanGuard的0到15位的数值
        int m = (parallelism == 1 - a && blockedCount == 0) ? 0 : g & SMASK;
        ForkJoinWorkerThread[] ws = workers;
        if (ws == null || ws.length <= m) 
            return false;

        // 
        for (int r = w.seed, k = r, j = -(m + m); j <= m + m; ++j) {
            ForkJoinTask<?> t; ForkJoinTask<?>[] q; int b, i;
            // 从线程队列中随机获取一个worker线程
            ForkJoinWorkerThread v = ws[k & m];
            // 判断Worker线程是否存在以及该线程的任务队列是否有任务
            if (v != null && (b = v.queueBase) != v.queueTop &&
                (q = v.queue) != null && (i = (q.length - 1) & b) >= 0) {
                // 从队列中偷走一个任务
                long u = (i << ASHIFT) + ABASE;
                if ((t = q[i]) != null && v.queueBase == b &&
                    UNSAFE.compareAndSwapObject(q, u, t, null)) {
                    int d = (v.queueBase = b + 1) - v.queueTop;
                    v.stealHint = w.poolIndex;
                    // d是偷走一个任务后任务队列的长度
                    if (d != 0)
                        signalWork();
                    w.execTask(t);
                }
                r ^= r << 13; r ^= r >>> 17; w.seed = r ^ (r << 5);
                // false表示扫描到了任务
                return false;
            }
            else if (j < 0) {                     // 异或移位，更新k
                r ^= r << 13; r ^= r >>> 17; k = r ^= r << 5;
            }
            else
                ++k;
        }

        // 如果扫描不到任务，但是scanGuard被更新了，说明有任务的变化
        if (scanGuard != g)
            return false;
        else {
            // 从线程池的任务队列中取出任务来执行
            ForkJoinTask<?> t; ForkJoinTask<?>[] q; int b, i;
            if ((b = queueBase) != queueTop &&
                (q = submissionQueue) != null &&
                (i = (q.length - 1) & b) >= 0) {
                long u = (i << ASHIFT) + ABASE;
                if ((t = q[i]) != null && queueBase == b &&
                    UNSAFE.compareAndSwapObject(q, u, t, null)) {
                    queueBase = b + 1;
                    w.execTask(t);
                }
                return false;
            }
            return true;
        }
    }

ForkJoinTask的join方法都发生了什么：
复制代码

public final V join() {
    // doJoin方法返回该任务的状态，状态值有三种：
    // NORMAL, CANCELLED和EXCEPTIONAL
    // join的等待过程在doJoin方法中进行
    if (doJoin() != NORMAL)
        // reportResult方法针对任务的三种状态有三种处理方式：
        // NORMAL: 直接返回getRawResult()方法的返回值
        // CANCELLED: 抛出CancellationException
        // EXCEPTIONAL: 如果任务执行过程抛出了异常，则抛出该异常，否则返回getRawResult()
        return reportResult();
    else
        // getRawResult是抽象方法，由子类来实现
        return getRawResult();
}

复制代码

RecursiveAction和RecursiveTask实现了getRawResult方法。

RecursiveAction用于没有返回值的场合，因此getRawResult方法返回null。

RecursiveTask用于有返回值的场合，因此返回的是抽象方法compute方法的返回值。

接下来继续看join的核心方法doJoin方法：

 private int doJoin() {
        Thread t; ForkJoinWorkerThread w; int s; boolean completed;
        // 针对ForkJoinWorkerThread调用join的情况
        if ((t = Thread.currentThread()) instanceof ForkJoinWorkerThread) {
            // status值的初始化值是0，在任务没有完成以前一直是非负值
            // 因此一旦status的值变成负数，表示任务已经完成，直接返回
            if ((s = status) < 0)
                return s;
            // 检查当前worker线程的任务栈（因为采用LIFO方式，所有这里称为栈）
            // 的栈顶的任务是不是当前任务，如果是，从栈中取走该任务并执行
            // 然后返回执行之后任务的状态
            if ((w = (ForkJoinWorkerThread)t).unpushTask(this)) {
                try {
                    completed = exec();
                } catch (Throwable rex) {
                    return setExceptionalCompletion(rex);
                }
                if (completed)
                    return setCompletion(NORMAL);
            }
            // 如果不是栈顶任务的情况
            return w.joinTask(this);
        }
        else
            // 外部线程等待任务结束的情况
            return externalAwaitDone();
    }

前面文章中曾经举了几个例子来演示如何实现RecursiveTask的子类。在compute方法中会看到了join方法的调用，也就是ForkJoinWorkerThread调用join的情况。

因此首先来看ForkJoinWorkerThread的joinTask方法的实现：

 final int joinTask(ForkJoinTask<?> joinMe) {
        ForkJoinTask<?> prevJoin = currentJoin;
        currentJoin = joinMe;
        for (int s, retries = MAX_HELP;;) {
            // 当前任务已经完成，返回到前面一个join的任务
            if ((s = joinMe.status) < 0) {
                currentJoin = prevJoin;
                return s;
            }

            // 剩余的尝试次数大于0（MAX_HELP值为16）的情况，继续做尝试
            if (retries > 0) {
                if (queueTop != queueBase) {
                    // 检查当前线程的任务栈，如果任务栈不为空，当前任务处在栈顶位置则
                    // 执行该任务返回true，否则返回false，直接认为尝试失败
                    if (!localHelpJoinTask(joinMe))
                        retries = 0;
                }
                // 尝试了最大允许次数的一半
                else if (retries == MAX_HELP >>> 1) {
                    --retries;
                    // 检查当前任务是否在某个worker线程的任务队列的队首位置
                    // 如果是的话，偷走这个任务并且执行掉该任务。tryDeqAndExec
                    // 返回任务的status值，因此大于等于0意味着任务还没有执行结束，
                    // 当前线程让出控制权以便其他线程执行任务
                    if (tryDeqAndExec(joinMe) >= 0)
                        Thread.yield();
                }
                else
                    // helpJoinTask方法检查当前任务是不是被某个Worker线程偷走了，
                    // 并且是这个线程最新偷走的任务（currentSteal），如果是的话，
                    // 当前线程帮助执行这个任务，这个过程成功则返回true
                    retries = helpJoinTask(joinMe) ? MAX_HELP : retries - 1;
            }
            else {
                // 尝试了最大允许次数还没有成功，重置以便再次尝试
                retries = MAX_HELP;

                // 一轮尝试失败，进入进程池等待任务
                pool.tryAwaitJoin(joinMe);
            }
        }
    }

来看一轮尝试失败之后，调用线程池的tryAwaitJoin方法会发生一些什么：

    final void tryAwaitJoin(ForkJoinTask<?> joinMe) {
        int s;
        // 检查任务是否结束之前先清除当前线程的中断状态
        // 因为tryAwaitDone会调用wait可能产生中断异常
        Thread.interrupted();
        // 任务还在执行的情况，否则执行完成就直接返回
        if (joinMe.status >= 0) {
            // blockedCount加1，把当前线程标记为阻塞
            // 成功则返回true，否则返回false
            if (tryPreBlock()) {
                // 调用wait方法等待任务完成
                joinMe.tryAwaitDone(0L);
                // blockedCount减1，把当前线程标记为活跃状态
                postBlock();
            }
            // 线程处于关闭状态的情况，取消该任务
            else if ((ctl & STOP_BIT) != 0L)
                joinMe.cancelIgnoringExceptions();
        }
    }

最后又回归到了原点，来看task的tryAwaitDone方法：

   final void tryAwaitDone(long millis) {
        int s;
        try {
            // status为0，设为1。成功了然后才会用wait等待
            if (((s = status) > 0 ||
                 (s == 0 &&
                  UNSAFE.compareAndSwapInt(this, statusOffset, 0, SIGNAL))) &&
                status > 0) {
                synchronized (this) {
                    if (status > 0)
                        wait(millis);
                }
            }
        } catch (InterruptedException ie) {
            // 因为wait被中断了，不能保证任务被正确执行结束，因此调用该方法时要注意
            // 检查任务是否已经执行结束了
    }

走完了Worker线程内的join的流程，最后来看其他线程join等待发生了什么，来看externalAwaitDone方法：

  private int externalAwaitDone() {
        int s;

        if ((s = status) >= 0) {
            boolean interrupted = false;
            synchronized (this) {
                // 循环等待直到任务执行结束
                while ((s = status) >= 0) {
                    if (s == 0)
                        UNSAFE.compareAndSwapInt(this, statusOffset,
                                                 0, SIGNAL);
                    else {
                        try {
                            wait();
                        } catch (InterruptedException ie) {
                            interrupted = true;
                        }
                    }
                }
            }
            // 清除中断状态
            if (interrupted)
                Thread.currentThread().interrupt();
        }
        return s;
    }

externalAwaitDone逻辑较为简单，采用循环的方式，使用wait方法等待直到任务执行结束。

既然使用wait方法等待，那么必然在任务执行结束后需要调用notify或者notifyAll的方法，在setCompletion方法找到了：

 private int setCompletion(int completion) {
        for (int s;;) {
            if ((s = status) < 0)
                return s;
            if (UNSAFE.compareAndSwapInt(this, statusOffset, s, completion)) {
                if (s != 0)
                    synchronized (this) { notifyAll(); }
                return completion;
            }
        }
    }