Excel文件解析以及超大Excel文件读写

本文介绍了Java中处理Excel的主流技术,包括Apache POI和Alibaba EasyExcel。Apache POI提供了对Excel文件的读写功能,而EasyExcel采用逐行读取模式,适合大数据量文件。文章详细讲解了如何使用XSSF解析和创建新版本的Excel文件,并对比了处理超大文件时,SXSSFWorkbook和EasyExcel的适用场景。对于内存有限的系统,推荐使用EasyExcel进行超大文件的读写。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.概述

         在应用程序的开发过程中,经常需要使用Excel 文件来进行数据的导入或导出。所以,在通过ava语言实现此类需求的时候,往往会面临着Excel文件的解析(导入)或生成(导出)。
        在Java技术生态圈中,可以进行Excel文件处理的主流技术包括: Apache POI 、JXL 、Alibaba EasyExcel 等。
        Apache POI 基于DOM方式进行解析,将文件直接加载内存,所以速度较快,适合Excel 文件数据量不大的应用场景。JXL只支持Excel 2003以下版本,所以不太常见。
        Alibaba EasyExcel 采用逐行读取的解析模式,将每一行的解析结果以观察者的模式通知处理
( AnalysisEventListener ) , 所以比较适合数据体量较大的Excel 文件解析。

2.Apache POI

        Apache POI是用Java 编写的免费开源的跨平台的Java API,Apache POI提供给Java 程序对Microsoft office 格式档案进行读写功能的API 开源类库:
        JURCE - 它分别提供对不同格式文件的解析:
        HSSF - 提供读写Microsoft Excel格式档案的功能。
        XSSF - 提供读写Microsoft Excel OOXML格式档案的功能。
        HWPF - 提供读写Microsoft Word格式档案的功能。
        HSLF - 提供读写Microsoft PowerPoint格式档案的功能。
        HDGF - 提供读写 Microsoft Visio格式档案的功能。

3.使用XSSF解析Excel文件

        HSSF用于解析旧版本( *.xIs ) Excel文件,由于旧版本的Excel文件只能存在65535行数据,所以目前已经不常用。所以目前主要采用XSSF进行新版本( *.xlsx ) Exce文件的解析。

创建Excel文件 

         当我们要解析一个Excel文件时,需要创建一个Workbook的实现类XSSFWorkbook,它就代表了一个Excel文件,

try (Workbook workbook = new XSSFWorkbook();
				FileOutputStream fos = new FileOutputStream("D:\\share\\Demo01.xlsx")) {
    workbook.write(fos);
} catch (IOException e) {
    e.printStackTrace();
}

 加载Excel文件

        可以创建FileInputStream文件输入流对象那指定路径下的Excel文件传入到XSSFWorkbook中,推荐写入到try-with-resources中例如:

// 输入流
FileInputStream fis = new FileInputStream("D:\\share\\Demo01.xlsx");

// Excel文件对象
Workbook workbook = new XSSFWorkbook(fis);

 Sheet(工作簿)

         创建工作簿对象

// 按照默认名称创建工作簿
Sheet sheet1 = workbook.createSheet();

// 按照自定义名称创建工作簿
Sheet sheet2 = workbook.createSheet("自定义工作簿2");

        获取工作簿

// 按照名称获取工作簿
// org.apache.poi.ss.usermodel.Sheet ss包下的
Sheet sheet0 = workbook.getSheet("Sheet0");

// 按照下标获取工作簿
Sheet sheet1 = workbook.getSheetAt(1);"Sheet0");

        获取工作簿的数量

int n = workbook.getNumberOfSheets();

Row(行数据)

        通过sheet来进行数据行的获取或创建

获取当前数据行

Row row = sheet.createRow(0);

获取首行下标

int first = sheet.getFirstRowNum();

获取尾行下标 

int last = sheet.getLastRowNum();

根据下标获取指定行 

Row row = sheet.getRow(0);

遍历所有行

for(Row row : sheet) {
    System.out.println(row);
}

 遍历指定行

for (int i = 1; i <= sheet.getLastRowNum(); i++) {
    Row row = sheet.getRow(i);
    System.out.println(row);
}

 

Cell单元格

创建单元格 

Cell cell0 = row.createCell(0);

设置单元格值

cell0.setCellValue(//对应类型数据值);

根据下标获取单元格

Cell cell = row.getCell(1);

遍历所有单元格

for(Cell cell : row) {
				
}

获取单元格的类型

CellType type = cell.getCellType();

设置单元格样式

// 创建单元格样式
DataFormat dataFormat = workbook.createDataFormat();
Short formatCode = dataFormat.getFormat("yyyy-MM-dd HH:mm:ss");
CellStyle cellStyle = workbook.createCellStyle();
cellStyle.setDataFormat(formatCode);

// ...

// 为当前行创建单元格
Cell cell1 = row.createCell(1);
cell1.setCellStyle(cellStyle); // 设置单元格样式
cell1.setCellValue(new Date()); // 保存当前日期时间至本单元格

设置单元格对齐方式

// 创建单元格样式
CellStyle cellStyle = workbook.createCellStyle();

//设置单元格的水平对齐类型。 此时水平居中
cellStyle.setAlignment(HorizontalAlignment.CENTER);

// 设置单元格的垂直对齐类型。 此时垂直靠底边
cellStyle.setVerticalAlignment(VerticalAlignment.BOTTOM);

4.超大Excel文件读写

        一般进行超大Excel文件的读写,一般两种方式,第一种使用SXSSFWorkbook进行写入,通过设置SXXFWorkbook 的构造参数,可以设置每次在内存中保持的行数,当达到这个值的时候,那么会把这些数据flush 到磁盘上,这样就不会出现内存不够的情况。第二种使用阿里巴巴提供的EasyExcel工厂类进行写入读取操作。但是对于不同电脑,不同CPU,不同内存读写的速度也是不同的。

        我的电脑比较老CPU是Intel(R) Core(TM) i5-3320M CPU @ 2.60GHz 2.60 GHz,内存(RAM)是4.00GB,以下是对应的使用EasyExcel写入100万条数据运行后统计的总耗时:

         我的电脑如果使用SXSSFWorkbook来进行一般的读入数据直接把IDEA卡到无响应,作者也是很无奈,所以更推荐与使用EasyExcel来进行超大Excel文件的读写。

 

sxssfworkbook是Apache POI库中的一个类,用于读取Excel文件。它是一种基于事件模型的处理方式,能够处理大量数据而不会占用太多的内存。 要使用sxssfworkbook读取Excel文件,首先需要创建一个工作簿对象。可以使用以下代码来创建一个sxssfworkbook对象: ``` // 创建一个文件输入流对象 FileInputStream fis = new FileInputStream(new File("test.xlsx")); // 创建一个SXSSFWorkbook对象 SXSSFWorkbook wb = new SXSSFWorkbook(new XSSFWorkbook(fis), 1000); ``` 其中,第一个参数是文件输入流对象,指定要读取的Excel文件。第二个参数是缓存区的大小,指定在处理Excel文件时一次读取的数据行数。 接下来,可以使用wb对象的getSheetAt()方法来获取要读取的工作表对象。例如,如果要读取第一个工作表,可以使用以下代码: ``` // 获取第一个工作表 SXSSFSheet sheet = wb.getSheetAt(0); ``` 然后,可以使用sheet对象的getRow()方法来获取行对象,使用row对象的getCell()方法来获取单元格对象,最后使用cell对象的getStringCellValue()方法来获取单元格的值。例如,如果要获取第一行第一列的单元格值,可以使用以下代码: ``` // 获取第一行第一列的单元格值 SXSSFRow row = sheet.getRow(0); SXSSFCell cell = row.getCell(0); String value = cell.getStringCellValue(); ``` 最后,记得在读取完Excel文件后关闭文件输入流对象和工作簿对象,以释放资源。可以使用以下代码来关闭这些对象: ``` // 关闭文件输入流对象 fis.close(); // 关闭工作簿对象 wb.close(); ``` 以上就是使用sxssfworkbook读取Excel文件的基本流程。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ButNullPointer

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值