一个使用POI进行Excel多线程写操作的demo

本文介绍了如何使用POI框架结合多线程和CountDownLatch实现高效的大数据量Excel文件写入操作。通过线程池管理并发任务,利用CountDownLatch确保所有任务完成后再进行文件输出,提高了写入效率并保证了数据一致性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近项目中要使用 POI 进行Excel大数据量写入的功能,以下是alex写的一个简单demo。其中,使用了ThreadPoolExecutor、CountDownLatch。由于POI的sheet中使用TreeMap存储行数据集,所以对Sheet的行创建是非线程安全的,所以进行了同步操作。
package com.alex.frameworkDemo.poi;

import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.util.concurrent.CountDownLatch;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;

import org.apache.poi.hssf.usermodel.HSSFCell;
import org.apache.poi.hssf.usermodel.HSSFRow;
import org.apache.poi.hssf.usermodel.HSSFSheet;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;

/**
 * 测试POI
 * @author alex
 *
 */
public class PoiTest {

	public static void main(String[] args) {
		multiThreadWrite();
	}
	
	/**
	 * 使用多线程进行Excel写操作,提高写入效率。
	 */
	public static void multiThreadWrite() {
		/**
		 * 使用线程池进行线程管理。
		 */
		ExecutorService es = Executors.newCachedThreadPool();
		/**
		 * 使用计数栅栏
		 */
		CountDownLatch doneSignal = new CountDownLatch(3);

		HSSFWorkbook wb;
		try {
			wb = new HSSFWorkbook(new FileInputStream("E:\\temp\\poiTest.xls"));
			HSSFSheet sheet = wb.getSheetAt(0);
			es.submit(new PoiWriter(doneSignal, sheet, 0, 19999));
			es.submit(new PoiWriter(doneSignal, sheet, 20000, 39999));
			es.submit(new PoiWriter(doneSignal, sheet, 40000, 59999));
			/**
			 * 使用CountDownLatch的await方法,等待所有线程完成sheet操作
			 */
			doneSignal.await();
			es.shutdown();
			FileOutputStream os = new FileOutputStream("E:\\temp\\poiTest.xls");
			wb.write(os);
			os.flush();
			os.close();
			System.out.println("Excel completed......");
		} catch (FileNotFoundException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		} catch (InterruptedException e) {
			e.printStackTrace();
		}
	}
	
	/**
	 * 测试基本的POI写操作
	 */
	public static void poiBasicWriteTest() {
		try {
			HSSFWorkbook wb = new HSSFWorkbook(new FileInputStream(
					"E:\\temp\\poiTest.xls"));
			HSSFSheet sheet = wb.getSheetAt(0);
			HSSFRow row = sheet.createRow(0);
			HSSFCell contentCell = row.createCell(0);
			contentCell.setCellValue("abc");
			FileOutputStream os = new FileOutputStream("E:\\temp\\poiTest.xls");
			wb.write(os);
			os.flush();
		} catch (FileNotFoundException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		}
	}
	
	/**
	 * sheet的row使用treeMap存储的,是非线程安全的,所以在创建row时需要进行同步操作。
	 * @param sheet
	 * @param rownum
	 * @return
	 */
	private static synchronized HSSFRow getRow(HSSFSheet sheet, int rownum) {
		return sheet.createRow(rownum);
	}
	
	/**
	 * 进行sheet写操作的sheet。
	 * @author alex
	 *
	 */
	protected static class PoiWriter implements Runnable {

		private final CountDownLatch doneSignal;

		private HSSFSheet sheet;

		private int start;

		private int end;

		public PoiWriter(CountDownLatch doneSignal, HSSFSheet sheet, int start,
				int end) {
			this.doneSignal = doneSignal;
			this.sheet = sheet;
			this.start = start;
			this.end = end;
		}

		public void run() {
			int i = start;
			try {
				while (i <= end) {
					HSSFRow row = getRow(sheet, i);
					HSSFCell contentCell = row.getCell(0);
					if (contentCell == null) {
						contentCell = row.createCell(0);
					}
					contentCell.setCellValue(i + 1);
					++i;
				}
			} catch (Exception e) {
				e.printStackTrace();
			} finally {
				doneSignal.countDown();
				System.out.println("start: " + start + " end: " + end
						+ " Count: " + doneSignal.getCount());
			}
		}

	}
}

### Java中实现多线程并发写入Excel的最佳实践 在Java应用程序中,使用多线程技术能够有效提升处理大量数据到Excel文件的速度。然而,由于Excel本身并不完全支持真正的并行写入操作,因此需要采取一些策略来优化这一过程。 #### 使用线程池管理任务执行 创建固定大小的线程池有助于合理分配资源,并防止因过多线程而导致系统过载。对于大规模的数据集来说,可以根据硬件配置适当调整线程数量以获得最佳性能[^1]。 ```java ExecutorService executor = Executors.newFixedThreadPool(5); // 创建具有五个工作线程的线程池 ``` #### 数据分割与预处理 将待写入的数据按照一定规则划分为若干部分交给不同的线程去处理。比如按照行数均分给各个子任务,在每个子任务内部先构建好要写入的内容再统一提交给主线程汇总[^2]。 #### 解决同步问题 为了避免竞争条件的发生,在涉及到共享资源的操作时应当采用适当的锁机制。虽然`synchronized`会使得某些情况下原本期望的并行变为顺序执行,但在特定场景下仍然是必要的选择;另外还可以考虑利用更高效的并发集合类如`ConcurrentHashMap`等替代传统容器[^4]。 #### 利用第三方库简化开发难度 像Apache POI这样的开源项目提供了丰富的API用于读取和编Microsoft Office文档格式,而EasyExcel则是针对大容量表格进行了特别优化的一个轻量级框架,它不仅易于集成而且内置了许多实用特性可以帮助开发者快速搭建起高效稳定的Excel导入导出模块。 下面给出一段基于上述原则编的简单示例代码: ```java import com.alibaba.excel.EasyExcel; import java.util.ArrayList; import java.util.List; public class MultiThreadedExcelWriter { private static final int THREAD_COUNT = Runtime.getRuntime().availableProcessors(); public void writeDataToExcel(String filePath, List<List<String>> allRows) { ExecutorService threadPool = Executors.newFixedThreadPool(THREAD_COUNT); try { EasyExcel.write(filePath).sheet("Sheet").doWrite(() -> { List<List<String>> batchRows = new ArrayList<>(); synchronized (allRows) { // Ensure safe access to shared list while (!allRows.isEmpty()) { batchRows.add(allRows.remove(0)); if (batchRows.size() >= 100 || allRows.isEmpty()) break; // Write batches of up to 100 rows at once } } return batchRows.stream(); }); threadPool.shutdown(); threadPool.awaitTermination(Long.MAX_VALUE, TimeUnit.NANOSECONDS); } catch (InterruptedException e) { Thread.currentThread().interrupt(); // Restore interrupted status throw new RuntimeException(e); } } } ``` 此段代码展示了如何结合EasyExcel以及JDK自带的并发工具包来进行批量化的Excel写入作业。注意这里采用了流式接口配合Lambda表达式的简洁语法风格,使整个逻辑更加清晰易懂。
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值