核心组件
- ForkJoinPool
- ForkJoinTask
表示可并行执行的任务。它有两个常用子类:- RecursiveTask:用于有返回值的任务。
- RecursiveAction:用于无返回值的任务。
原理
-
任务拆分(Fork)
当一个大任务提交到 ForkJoinPool 后,框架会判断任务是否足够小。如果任务规模过大,则将其拆分成多个更小的子任务。这个拆分过程通常是递归的,直到子任务规模足够小,可以直接计算。 -
并行执行
拆分后的小任务被提交到 ForkJoinPool 中的工作线程中并行执行。由于采用了工作窃取算法,即使某些线程任务执行完毕,空闲的线程也可以“窃取”其他线程的子任务,进一步提高并行度。 -
结果合并(Join)
每个子任务完成后,其结果会返回给父任务,父任务将这些子任务的结果进行合并,最终返回整个大任务的计算结果。
示例代码
import java.util.concurrent.RecursiveTask;
import java.util.concurrent.ForkJoinPool;
// 定义一个简单的任务,用于计算数组中某个区间的和
public class SimpleSum extends RecursiveTask<Integer> {
private int[] nums; // 数组数据
private int start; // 起始下标(包含)
private int end; // 结束下标(不包含)
// 拆分任务的阈值,区间长度小于或等于这个值时直接计算
private static final int THRESHOLD = 5;
public SimpleSum(int[] nums, int start, int end) {
this.nums = nums;
this.start = start;
this.end = end;
}
@Override
protected Integer compute() {
// 当任务足够小时直接计算
if (end - start <= THRESHOLD) {
int sum = 0;
for (int i = start; i < end; i++) {
sum += nums[i];
}
return sum;
} else {
// 否则,拆分任务为左右两部分
int mid = (start + end) / 2;
SimpleSum leftTask = new SimpleSum(nums, start, mid);
SimpleSum rightTask = new SimpleSum(nums, mid, end);
// 异步执行左边任务
leftTask.fork();
// 直接计算右边任务
int rightResult = rightTask.compute();
// 等待左边任务完成并合并结果
int leftResult = leftTask.join();
return leftResult + rightResult;
}
}
public static void main(String[] args) {
// 初始化一个包含 1 到 20 的数组
int[] nums = new int[20];
for (int i = 0; i < nums.length; i++) {
nums[i] = i + 1;
}
// 创建 ForkJoinPool 并提交任务
ForkJoinPool pool = new ForkJoinPool();
SimpleSum task = new SimpleSum(nums, 0, nums.length);
int result = pool.invoke(task);
System.out.println("数组的总和为:" + result);
}
}
说明
-
任务拆分:
当计算区间长度大于THRESHOLD
时,任务会被拆分成两个子任务:左半部分和右半部分。 -
Fork 与 Join:
-
调用
fork()
将左边的子任务异步提交到线程池。 -
最后调用
join()
等待左边任务的结果,然后将左右结果相加返回。
-
-
结果合并:
每个任务返回其计算结果,父任务通过合并这些结果来得到整个数组的总和。
说明
在任务拆分的代码中,我们通常会这样写:
leftTask.fork(); // 将左边任务异步提交到线程池
int rightResult = rightTask.compute(); // 当前线程直接计算右边任务
int leftResult = leftTask.join(); // 等待左边任务执行完毕并获取结果
return leftResult + rightResult;
这种模式的好处是:
- 当前线程在等待 fork 的任务完成之前,能够充分利用 CPU 直接计算 rightTask,从而减少任务调度开销;
- 能够提高整体性能,因为避免了额外的任务提交和线程切换。
可以同时调用 rightTask.fork() 吗?
从技术上讲,你可以这样写:
leftTask.fork();
rightTask.fork();
int leftResult = leftTask.join();
int rightResult = rightTask.join();
return leftResult + rightResult;
这样做会将两个子任务都异步提交给线程池,然后当前线程等待这两个任务执行完毕。然而,这种方式并不一定能带来性能上的优势,因为:
- 当前线程在调用 join() 前没有实际参与计算,可能导致线程空闲;
- 如果线程池中的线程资源有限,过多的任务调度可能增加额外开销。