Java【代码 09】多线程处理List数据核心代码说明(下标越界、数据丢失及效率问题)

多线程处理List数据核心代码说明

1.问题说明

大数据量的List问题处理,多线程分批处理,需要解决的问题:

  • 下标越界。
  • 线程安全。
  • 数据丢失。
    private List<Map<String, Object>> dealDataByThreads(List<String> dataList) {
        int dataSize = dataList.size();
        // 结果数据【1】
        List<Map<String, Object>> dataMap = Collections.synchronizedList(new ArrayList<>(dataSize));
        // 每批的记录数据并计算批次
        int numberBatch = 2000;
        double number = dataSize * 1.0 / numberBatch;
        int n = ((Double) Math.ceil(number)).intValue();
        // 根据参数开启线程
        CountDownLatch countDownLatch = new CountDownLatch(n);
        ThreadPoolExecutor executor = ThreadManager.executor;
        // 分批处理数据
        for (int i = 0; i < n; i++) {
            // 计算sub的toIndex
            int end = numberBatch * (i + 1);
            if (end > dataSize) {
                end = dataSize;
            }
            // 获取分批数据
            List<String> dataListSub = dataList.subList(numberBatch * i, end);
            int finalI = i;
            int finalEnd = end;
            executor.submit(() -> {
                long startMillis = System.currentTimeMillis();
                //【2】
                dataMap.addAll(dealData(dataListSub));
                countDownLatch.countDown();
                long endMillis = System.currentTimeMillis();
                log.info("当前线程[{}]处理{}-{}/{}耗时[{}]毫秒", Thread.currentThread().getName(), numberBatch * finalI, finalEnd, dataSize, endMillis - startMillis);
            });
        }
        // 主线程等待
        try {
            countDownLatch.await();
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
        return dataMap;
    }

2.代码说明

  1. 使用dataSize初始化 Map 对象,可以避免 Map 对象的重构导致的下标越界。
List<Map<String, Object>> dataMap = Collections.synchronizedList(new ArrayList<>(dataSize));
  1. 不要将dataMap对象给线程,dataMap.add(dataListSubAfterDeal) 方法可能会覆盖 List 内的对象。
// 正确方式
dataMap.addAll(dealData(dataListSub));
// 错误方式
dealData(dataListSub,dataMap);
dataMap.add(dataListSubAfterDeal);
  1. 为什么不使用线程安全的VectorCopyOnWriteArrayList
// 没有达到多线程期待的效果。

3.方案效率

3 > 2 >1

// 1.线程安全,性能较低,没有达到多线程期待的效果。
Vector<Map<String, Object>> vector = new Vector<>(dataSize);

// 2.CopyOnWriteArrayList比Vector效率好一些前者synchronized后者lock
List<Map<String, Object>> resultList = new CopyOnWriteArrayList<>();

// 3.Collections.synchronizedList将线程不安全的集合转成线程安全的集合
List<Map<String, Object>> dataMap = Collections.synchronizedList(new ArrayList<>(dataSize));
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

シ風

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值