POI 读取 Excel 文件(2003版本与2007版本的差异之处)

本文介绍了在使用POI库处理Excel文件时遇到的版本不兼容问题,通过引入XSSF和HSSF两种jar包并根据Excel版本选择相应的实现方式,成功解决了读取和写入不同版本Excel文件时出现的异常问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

已整理成完整项目,并进行了优化。看参考地址:

https://gitee.com/andy_longjie/exceltools   或者 https://github.com/youmulongjie/exceltools

我们在做用POI读物 Excel文件时,往往会忽略了Excel的版本,到底是2003还是2007。于是在读取或写入Excel文件时,用2003版本的Excel和用2007版本的Excel文件,会出现不兼容情况。抛出异常,大概信息如下:org.apache.poi.poifs.filesystem.OfficeXmlFileException: The supplied data appears to be in the Office 2007+ XML. You are calling the part of POI that deals with OLE2 Office Documents. You need to call a different part of POI to process this data (eg XSSF instead of HSSF);

异常指出我们用了Office2007以上的版本(包含2007),要我们用XSSF来代替HSSF。

于是我们开始替换我们的代码,用XSSF代替HSSF。可是我们却意外的发现poi.jar包中,并不包含XSSF,那么XSSF到底从哪来的呢?百度一下发现,他们来自不同的星球:

(1)XSSFWorkbook:poi-ooxml-.jar                           org.apache.poi.xssf.usermodel.XSSFWorkbook
(2)HSSFWorkbook:poi.jar                                      org.apache.poi.hssf.usermodel.HSSFWorkbook

查看源码:

多么的巧合啊!HSSFWorkbook 和 XSSFWorkbook 都实现了 Workbook 接口!

所以思路就来了,我们用时引入这两种jar包,在判断出Excel的版本号,根据Excel版本的不同来用HSSFWorkbook 或者XSSFWorkbook 的实现 Workbook。下面就直接上代码吧!

POI的版本号:

 

<poi.version>3.12</poi.version>
<dependency>
	<groupId>org.apache.poi</groupId>
	<artifactId>poi</artifactId>
	<version>${poi.version}</version>
</dependency>
<dependency>
	<groupId>org.apache.poi</groupId>
	<artifactId>poi-ooxml</artifactId>
	<version>${poi.version}</version>
</dependency>

读取Excel文件的Java类:

 

 

/**
 * @package :com.changhongit.andy.util<br>
 * @author :wanglongjie<br>
 * @createDate :2015年8月31日下午1:37:32<br>
 */
package com.changhongit.andy.util;

import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.text.SimpleDateFormat;
import java.util.ArrayList;
import java.util.Date;
import java.util.Iterator;
import java.util.LinkedHashMap;
import java.util.List;
import java.util.Map;
import java.util.Map.Entry;

import org.apache.poi.hssf.usermodel.HSSFDateUtil;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.poifs.filesystem.POIFSFileSystem;
import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;

/**
 * @package :com.changhongit.andy.util<br>
 * @file :ExcelReader.java<br>
 * @describe :读取 Excel 文件<br>
 * @author :wanglongjie<br>
 * @createDate :2015年8月31日下午1:37:32<br>
 * @updater :<br>
 * @updateDate :<br>
 * @updateContent :<br>
 */
public class ExcelReader {
	static private Workbook wb;
	static private Sheet sheet;
	static private Row row;

	/**
	 * 
	 * @method :readExcelTitle<br>
	 * @describe :读取 Excel 文件<br>
	 * @author :wanglongjie<br>
	 * @createDate :2015年8月31日下午2:41:25 <br>
	 * @param fileName
	 *            :Excel 文件路径
	 * @return String[]
	 */
	public static String[] readExcelTitle(String fileName) {
		InputStream is;
		try {
			is = new FileInputStream(fileName);
			String postfix = fileName.substring(fileName.lastIndexOf("."),
					fileName.length());
			if (postfix.equals(".xls")) {
				// 针对 2003 Excel 文件
				wb = new HSSFWorkbook(new POIFSFileSystem(is));
				sheet = wb.getSheetAt(0);
			} else {
				// 针对2007 Excel 文件
				wb = new XSSFWorkbook(is);
				sheet = wb.getSheetAt(0);
			}
		} catch (IOException e) {
			e.printStackTrace();
		}
		sheet = wb.getSheetAt(0);
		row = sheet.getRow(0);// 获取第一行(约定第一行是标题行)
		int colNum = row.getPhysicalNumberOfCells();// 获取行的列数
		String[] titles = new String[colNum];
		for (int i = 0; i < titles.length; i++) {
			titles[i] = getCellFormatValue(row.getCell(i));
		}
		return titles;
	}

	/**
	 * 
	 * @method :readExcelContent<br>
	 * @describe :读取 Excel 内容<br>
	 * @author :wanglongjie<br>
	 * @createDate :2015年8月31日下午3:12:06 <br>
	 * @param fileName
	 *            :Excel 文件路径
	 * @return List<Map<String,String>>
	 */
	public static List<Map<String, String>> readExcelContent(String fileName) {
		List<Map<String, String>> list = new ArrayList<>();
		Map<String, String> content = null;
		try {
			InputStream is;
			is = new FileInputStream(fileName);
			String postfix = fileName.substring(fileName.lastIndexOf("."),
					fileName.length());
			if (postfix.equals(".xls")) {
				// 针对 2003 Excel 文件
				wb = new HSSFWorkbook(new POIFSFileSystem(is));
				sheet = wb.getSheetAt(0);
			} else {
				// 针对2007 Excel 文件
				wb = new XSSFWorkbook(is);
				sheet = wb.getSheetAt(0);
			}
		} catch (IOException e) {
			e.printStackTrace();
		}
		sheet = wb.getSheetAt(0);
		int rowNum = sheet.getLastRowNum();// 得到总行数
		row = sheet.getRow(0);
		int colNum = row.getPhysicalNumberOfCells();
		String titles[] = readExcelTitle(fileName);
		// 正文内容应该从第二行开始,第一行为表头的标题
		for (int i = 1; i <= rowNum; i++) {
			int j = 0;
			row = sheet.getRow(i);
			content = new LinkedHashMap<>();
			do {
				content.put(titles[j], getCellFormatValue(row.getCell(j))
						.trim());
				j++;
			} while (j < colNum);
			list.add(content);
		}
		return list;
	}

	/**
	 * 根据Cell类型设置数据
	 * 
	 * @param cell
	 * @return
	 */
	private static String getCellFormatValue(Cell cell) {
		String cellvalue = "";
		if (cell != null) {
			// 判断当前Cell的Type
			switch (cell.getCellType()) {
			// 如果当前Cell的Type为NUMERIC
			case Cell.CELL_TYPE_NUMERIC:
			case Cell.CELL_TYPE_FORMULA: {
				// 判断当前的cell是否为Date
				if (HSSFDateUtil.isCellDateFormatted(cell)) {
					// 方法2:这样子的data格式是不带带时分秒的:2011-10-12
					Date date = cell.getDateCellValue();
					SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd");
					cellvalue = sdf.format(date);
				} else {
					// 如果是纯数字取得当前Cell的数值
					cellvalue = String.valueOf(cell.getNumericCellValue());
				}
				break;
			}
			// 如果当前Cell的Type为STRIN
			case Cell.CELL_TYPE_STRING:
				// 取得当前的Cell字符串
				cellvalue = cell.getRichStringCellValue().getString();
				break;
			default:
				// 默认的Cell值
				cellvalue = " ";
			}
		} else {
			cellvalue = "";
		}
		return cellvalue;

	}

	public static void main(String[] args) {
		String file = "E://Andy/work/Tomcat 7.0/webapps/customer/WEB-INF/upload/客户收支配置.xlsx";
		List<Map<String, String>> list = ExcelReader.readExcelContent(file);
		Map<String, String> map = null;
		for (int i = 0; i < list.size(); i++) {
			map = list.get(i);
			Entry<String, String> entry = null;
			for (Iterator<Entry<String, String>> it = map.entrySet().iterator(); it
					.hasNext();) {
				entry = it.next();
				System.out.println(entry.getKey() + "-->" + entry.getValue());
			}
			System.out.println("............");
		}
	}

}

主要的思路就是,我们在定义成员变量时不在定义某一种实现类,而是定义成接口:

 

 static private Workbook wb;
 static private Sheet sheet;
 static private Row row;

然后根据上传文件的后缀名,判断是2003Excel还是2007Excel,再决定用不同的类实现成员变量的接口,从而达到代码既支持2003Excel有支持2007Excel:

            InputStream is = new FileInputStream(fileName);
            String postfix = fileName.substring(fileName.lastIndexOf("."),
                    fileName.length());
            if (postfix.equals(".xls")) {
                // 针对 2003 Excel 文件
                wb = new HSSFWorkbook(new POIFSFileSystem(is));
                sheet = wb.getSheetAt(0);
            } else {
                // 针对2007 Excel 文件
                wb = new XSSFWorkbook(is);
                sheet = wb.getSheetAt(0);
            }

最后纠结了半天的问题终于解决了,欧耶

已整理成完整项目,并进行了优化。看参考地址:

https://gitee.com/andy_longjie/exceltools   或者 https://github.com/youmulongjie/exceltools

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值