Java8 parallel 遇到的坑

什么是Stream

Java8 引入的stream接口可以说一大亮点,对集合(Collection)对象功能的增强,它专注于对集合对象进行各种非常便利、高效的聚合操作(aggregate operation),或者大批量数据操作 (bulk data operation)。Stream API 借助于同样新出现的 Lambda 表达式,极大的提高编程效率和程序可读性。同时它提供串行和并行两种模式进行汇聚操作,并发模式能够充分利用多核处理器的优势,使用 fork/join 并行方式来拆分任务和加速处理过程。

我遇到的问题

直接上代码吧

				try {
					Stream<ServiceReference<FileMigrator>> migratorStream = fileMigrators.stream();

					migratorStream.map(
						_context::getService
					).parallel(
					).forEachOrdered(
						fm -> {
							List<Problem> fileProlbems = fm.analyze(file);

							if (ListUtil.isNotEmpty(fileProlbems)) {
								problems.addAll(fileProlbems);
							}
						}
					);
				}
				catch (Exception e) {
				}

这是一个利用并行,多个service对文件进行检查的一个测试的一部分。我发现在执行的过程中,发现的错误的数量是不稳定的,排除了代码的逻辑问题,因为我并没有对文件进行修改操作,所以不存在因为文件改变找不到错误点的问题。剩下的就是 我用了 parallel 并行的问题。注意并行不同于并发 可以参考一下这个博客

验证parallelStream是不是线程安全的

一个简单的例子,在下面的代码中采用stream的forEach接口对1-10000进行遍历,分别插入到3个ArrayList中。其中对第一个list的插入采用串行遍历,第二个使用paralleStream,第三个使用paralleStream的同时用ReentryLock对插入列表操作进行同步:

private static List<Integer> list1 = new ArrayList<>();
private static List<Integer> list2 = new ArrayList<>();
private static List<Integer> list3 = new ArrayList<>();
private static Lock lock = new ReentrantLock();

public static void main(String[] args) {
    IntStream.range(0, 10000).forEach(list1::add);

    IntStream.range(0, 10000).parallel().forEach(list2::add);

    IntStream.range(0, 10000).forEach(i -> {
    lock.lock();
    try {
        list3.add(i);
    }finally {
        lock.unlock();
    }
    });

    System.out.println("串行执行的大小:" + list1.size());
    System.out.println("并行执行的大小:" + list2.size());
    System.out.println("加锁并行执行的大小:" + list3.size());
}
串行执行的大小:10000
并行执行的大小:9595
加锁并行执行的大小:10000

并且每次的结果中并行执行的大小不一致,而串行和加锁后的结果一直都是正确结果。显而易见,stream.parallel.forEach()中执行的操作并非线程安全。

我用的一些方法进行弥补

  1. 直接加锁
				try {
					Stream<ServiceReference<FileMigrator>> migratorStream = fileMigrators.stream();

					migratorStream.map(
						_context::getService
					).parallel(
					).forEach(
						fm -> {
							lock.lock();
							try {
								List<Problem> fileProlbems = fm.analyze(file);

								if (ListUtil.isNotEmpty(fileProlbems)) {
									problems.addAll(fileProlbems);
								}
							}
							finally {
								lock.unlock();
							}
						}
					);
				}
				catch (Exception e) {
				}

经过多次测试,结果是正确的,得到的错误数量开始稳定了。方法可行,但是代码不优雅,加个lock,总是感觉有些突兀。

  1. 用synchronized
				List<ServiceReference<FileMigrator>> fileMigrators = Collections.synchronizedList(new ArrayList<ServiceReference<FileMigrator>>)

				.......

				try {
					Stream<ServiceReference<FileMigrator>> migratorStream = fileMigrators.stream();

					migratorStream.map(
						_context::getService
					).parallel(
					).forEachOrdered(
						fm -> {
							List<Problem> fileProlbems = fm.analyze(file);

							if (ListUtil.isNotEmpty(fileProlbems)) {
								problems.addAll(fileProlbems);
							}
						}
					);
				}
				catch (Exception e) {
				}

用这个方法,错误数量还是不太稳定,我会继续研究一下这块的问题。

  1. 用forEachOrdered 代替forEach(我推荐的)
				try {
					Stream<ServiceReference<FileMigrator>> migratorStream = fileMigrators.stream();

					migratorStream.map(
						_context::getService
					).parallel(
					).forEachOrdered(
						fm -> {
							List<Problem> fileProlbems = fm.analyze(file);

							if (ListUtil.isNotEmpty(fileProlbems)) {
								problems.addAll(fileProlbems);
							}
						}
					);
				}
				catch (Exception e) {
				}

这个是让parallel本来无须变得有序,可能会影响一点并行的效率,但是相对于单行的效率还是不可同年而语的。如果对于效率不是特别苛刻,我觉得本方法完全可行。
大家可以参考 这个链接

总结

parallelStream是线程不安全的,但不是不可避免的,可能还有很多比这些好很多的办法,希望大神能多多指点,踊跃留言,谢谢!

<think>嗯,用户想了解如何在Java中遍历数组元素。首先,我需要回忆一下Java中数组遍历的基本方法。常见的方式有几种,比如for循环、增强型for循环,可能还有使用迭代器或者流(Stream)的方式。不过数组本身没有迭代器,可能需要转换成集合类比如ArrayList才能用迭代器。而流是Java 8引入的,可能属于比较高级的内容,但用户可能也需要知道。 接下来,得考虑用户的需求层次。可能用户是刚学Java的新手,所以基础方法更重要。需要先介绍最基础的for循环,按索引遍历。这里要提到数组的length属性,以及索引从0开始到length-1结束。然后增强型for循环(foreach),更简洁,适合不需要索引的情况。这两种是最常用的。 然后,可能用户会想知道其他方法,比如使用Arrays类的stream方法,或者转换成列表后用迭代器。不过这些可能适用场景不同。比如流适合函数式编程,处理元素比较方便。迭代器的话,数组本身不支持,得先转成List,比如用Arrays.asList(),但要注意这个方法返回的列表是固定大小的,不能添加或删除元素,可能引发异常,所以需要提醒用户。 另外,可能需要考虑不同数据类型的数组,比如对象数组和基本类型数组(int[], double[]等),在转换成List时,基本类型数组会被当作一个单一对象处理,导致问题,比如Arrays.asList(intArray)会返回List<int[]>而不是List<Integer>,这可能是个,需要指出。 结构方面,应该分步骤讲解,每种方法给出示例代码,并说明优缺点。比如传统的for循环灵活,可以访问索引,修改元素;增强型for循环更简洁但无法修改元素或获取索引;迭代器需要转换数组到列表;流处理适合复杂操作,比如过滤、映射等。 还要注意代码的正确性,比如在传统for循环中,条件判断是i < array.length,而不是<=,避免越界。在增强型for循环中,变量类型要和数组元素类型一致,或者使用Object。 可能用户在实际应用中会遇到的问题,比如遍历时修改数组导致ConcurrentModificationException,但数组本身是固定长度的,如果用List的迭代器进行修改可能会有问题,需要说明。 最后,总结各种方法的适用场景,帮助用户根据需求选择合适的方法。比如需要索引或修改元素用传统for,只读且简洁用增强for,函数式处理用流。</think>在 Java 中遍历数组元素有以下几种常用方法,按使用频率排序: 一、基础 for 循环(索引遍历) ```java int[] numbers = {1, 2, 3, 4, 5}; for(int i = 0; i < numbers.length; i++) { System.out.println("索引 " + i + " 的值: " + numbers[i]); } ``` 特点: 1. 可访问元素索引 2. 可修改数组元素 3. 适用于需要精确控制遍历流程的场景 二、增强型 for 循环(foreach) ```java String[] fruits = {"苹果", "香蕉", "橙子"}; for(String fruit : fruits) { System.out.println(fruit); } ``` 特点: 1. 语法简洁 2. 无法获取当前索引 3. 不能修改数组元素(只能访问副本) 三、使用迭代器(需转换为 List) ```java import java.util.Arrays; import java.util.Iterator; Double[] prices = {9.9, 19.8, 29.7}; Iterator<Double> it = Arrays.asList(prices).iterator(); while(it.hasNext()) { System.out.println(it.next()); } ``` 注意: - 仅适用于对象类型数组(如 Integer[]) - 基本类型数组(如 int[])需先转换为包装类 四、Java 8 Stream API ```java char[] letters = {'A', 'B', 'C'}; Arrays.stream(letters).forEach(c -> System.out.println(c)); ``` 进阶用法: ```java int[] nums = {10, 20, 30}; Arrays.stream(nums) .filter(n -> n > 15) .forEach(System.out::println); ``` 特殊场景处理: 1. 多维数组遍历: ```java int[][] matrix = {{1,2}, {3,4}}; for(int[] row : matrix) { for(int num : row) { System.out.print(num + " "); } System.out.println(); } ``` 2. 并行遍历(多线程): ```java Arrays.stream(numbers).parallel().forEach(n -> { // 线程安全的操作 }); ``` 避指南: 1. `ArrayIndexOutOfBoundsException`:检查循环条件是否使用 `<` 而不是 `<=` 2. 基本类型数组转换时,应使用对应包装类型 3. 修改数组长度时,需创建新数组 根据实际需求选择方式: - 需要索引 → 基础 for 循环 - 只读遍历 → 增强型 for 循环 - 复杂操作 → Stream API - 多线程处理 → 并行流 所有遍历方法时间复杂度均为 $O(n)$,空间复杂度为 $O(1)$(Stream 并行流除外)
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值