Java并发编程之Fork/Join

最新推荐文章于 2025-07-16 14:52:33 发布

原创最新推荐文章于 2025-07-16 14:52:33 发布 · 428 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#java #算法 #数据结构

Java并发编程专栏收录该内容

23 篇文章

订阅专栏

核心组件

ForkJoinPool
ForkJoinTask
表示可并行执行的任务。它有两个常用子类：
- RecursiveTask：用于有返回值的任务。
- RecursiveAction：用于无返回值的任务。

原理

任务拆分（Fork）
当一个大任务提交到 ForkJoinPool 后，框架会判断任务是否足够小。如果任务规模过大，则将其拆分成多个更小的子任务。这个拆分过程通常是递归的，直到子任务规模足够小，可以直接计算。
并行执行
拆分后的小任务被提交到 ForkJoinPool 中的工作线程中并行执行。由于采用了工作窃取算法，即使某些线程任务执行完毕，空闲的线程也可以“窃取”其他线程的子任务，进一步提高并行度。
结果合并（Join）
每个子任务完成后，其结果会返回给父任务，父任务将这些子任务的结果进行合并，最终返回整个大任务的计算结果。

示例代码

import java.util.concurrent.RecursiveTask;
import java.util.concurrent.ForkJoinPool;

// 定义一个简单的任务，用于计算数组中某个区间的和
public class SimpleSum extends RecursiveTask<Integer> {
    private int[] nums;    // 数组数据
    private int start;     // 起始下标（包含）
    private int end;       // 结束下标（不包含）
    
    // 拆分任务的阈值，区间长度小于或等于这个值时直接计算
    private static final int THRESHOLD = 5;
    
    public SimpleSum(int[] nums, int start, int end) {
        this.nums = nums;
        this.start = start;
        this.end = end;
    }
    
    @Override
    protected Integer compute() {
        // 当任务足够小时直接计算
        if (end - start <= THRESHOLD) {
            int sum = 0;
            for (int i = start; i < end; i++) {
                sum += nums[i];
            }
            return sum;
        } else {
            // 否则，拆分任务为左右两部分
            int mid = (start + end) / 2;
            SimpleSum leftTask = new SimpleSum(nums, start, mid);
            SimpleSum rightTask = new SimpleSum(nums, mid, end);
            
            // 异步执行左边任务
            leftTask.fork();
            // 直接计算右边任务
            int rightResult = rightTask.compute();
            // 等待左边任务完成并合并结果
            int leftResult = leftTask.join();
            
            return leftResult + rightResult;
        }
    }
    
    public static void main(String[] args) {
        // 初始化一个包含 1 到 20 的数组
        int[] nums = new int[20];
        for (int i = 0; i < nums.length; i++) {
            nums[i] = i + 1;
        }
        
        // 创建 ForkJoinPool 并提交任务
        ForkJoinPool pool = new ForkJoinPool();
        SimpleSum task = new SimpleSum(nums, 0, nums.length);
        int result = pool.invoke(task);
        
        System.out.println("数组的总和为：" + result);
    }
}

说明

任务拆分：
当计算区间长度大于THRESHOLD时，任务会被拆分成两个子任务：左半部分和右半部分。
Fork 与 Join：
- 调用 fork() 将左边的子任务异步提交到线程池。
- 右边的任务直接通过 compute() 方法执行
- 最后调用 join() 等待左边任务的结果，然后将左右结果相加返回。
结果合并：
每个任务返回其计算结果，父任务通过合并这些结果来得到整个数组的总和。

说明

在任务拆分的代码中，我们通常会这样写：

leftTask.fork();                   // 将左边任务异步提交到线程池
int rightResult = rightTask.compute();  // 当前线程直接计算右边任务
int leftResult = leftTask.join();         // 等待左边任务执行完毕并获取结果
return leftResult + rightResult;

这种模式的好处是：

当前线程在等待 fork 的任务完成之前，能够充分利用 CPU 直接计算 rightTask，从而减少任务调度开销；
能够提高整体性能，因为避免了额外的任务提交和线程切换。

可以同时调用 rightTask.fork() 吗？

从技术上讲，你可以这样写：

leftTask.fork();
rightTask.fork();
int leftResult = leftTask.join();
int rightResult = rightTask.join();
return leftResult + rightResult;

这样做会将两个子任务都异步提交给线程池，然后当前线程等待这两个任务执行完毕。然而，这种方式并不一定能带来性能上的优势，因为：

当前线程在调用 join() 前没有实际参与计算，可能导致线程空闲；
如果线程池中的线程资源有限，过多的任务调度可能增加额外开销。