excel操作之poi-ooxml

本文对比了两种主流的Excel处理框架poi和jxl,从开发团队、优点、内存消耗、运行速度等方面进行了详细分析。并提供了poi的使用方法及代码示例,包括读取与写入Excel的操作流程,以及如何处理不同类型的Excel数据,如数字、日期、布尔值等。同时,介绍了如何使用poi-ooxml处理Excel 2007以上的版本,并提供了读取与写入Excel的代码实现。
     目前市场上流行的对于excel处理的框架大致有两种:poi和jxl。对于这两种框架,我们可以做一个简单的对比:
   1 开发团队:poi是Apache旗下的一个开源项目,由Apache官方维护,jxl好像是一个个人维护的开源项目。
   2 各自优点:poi对公式支持较好,jxl不算好 。jxl提供对图片的支持(仅仅PNG格式),poi支持。(就这一条来看财务软件就该选poi,而媒体类的软件就该选jxl了)
   3 内存消耗:由于jxl在对资源回收利用方面做了相当的功课,在内存消耗上jxl是略胜于poi的。所以对于大数据量的软件导入来说,选择jxl是比较合算的,当然数据量小的基本没有差别。
   4 运行速度: 估计是内存消耗多的缘故,poi对于读写速度这一功能做的好像比jxl好了不少,并且支持压缩excel。
    对比了这么多,对于自己项目该使用哪个框架,应该也十分明显了(当然这些也都是从网上搜集来的,不保证有错误的地方)。
    这里我记录一下poi的使用吧,都挺简单的,基本原理都是将excel表格数据提取出来组成一个list。然后对应这个list自己去做循环对应自己数据表的数据就行了。需要说明的一点是如果是数字类型的话,读出来的数据一般都是以double类型返回给你的,比如你在excel里面写的是100,读取出来的数据就是100.0.这点比较烦人,当然自己做一下处理就好了。
    还有一点就是poi也有两个不同的jar包,分别是处理excel2003和excel2007+的,对应的是poi和poi-ooxml。毕竟poi-ooxml是poi的升级版本,处理的单页数据量也是百万级别的,所以我们选择的也是poi-ooxml。好了,下面就贴上代码吧,注释较多,就不多做啰嗦了。,前提是引入包:
<!--poi对excel2007以上版本的支持-->
        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi-ooxml</artifactId>
            <version>3.12</version>
        </dependency>

   以下代码完全可以作为一个excel工具类迁移到自己的项目中:
/**
 * 处理excel读入的工具类
 * Created by Liujishuai on 2015/8/5.
 */
public class ExcelUtils {
    /**
     * 要求excel版本在2007以上
     *
     * @param file 文件信息
     * @return
     * @throws Exception
     */
    public static List<List<Object>> readExcel(File file) throws Exception {
        if(!file.exists()){
            throw new Exception("找不到文件");
        }
        List<List<Object>> list = new LinkedList<List<Object>>();
        XSSFWorkbook xwb = new XSSFWorkbook(new FileInputStream(file));
        // 读取第一张表格内容
        XSSFSheet sheet = xwb.getSheetAt(0);
        XSSFRow row = null;
        XSSFCell cell = null;
        for (int i = (sheet.getFirstRowNum() + 1); i <= (sheet.getPhysicalNumberOfRows() - 1); i++) {
            row = sheet.getRow(i);
            if (row == null) {
                continue;
            }
            List<Object> linked = new LinkedList<Object>();
            for (int j = row.getFirstCellNum(); j <= row.getLastCellNum(); j++) {
                Object value = null;
                cell = row.getCell(j);
                if (cell == null) {
                    continue;
                }
                switch (cell.getCellType()) {
                    case XSSFCell.CELL_TYPE_STRING:
                        //String类型返回String数据
                        value = cell.getStringCellValue();
                        break;
                    case XSSFCell.CELL_TYPE_NUMERIC:
                        //日期数据返回LONG类型的时间戳
                        if ("yyyy\"年\"m\"月\"d\"日\";@".equals(cell.getCellStyle().getDataFormatString())) {
                            //System.out.println(cell.getNumericCellValue()+":日期格式:"+cell.getCellStyle().getDataFormatString());
                            value = DateUtils.getMillis(HSSFDateUtil.getJavaDate(cell.getNumericCellValue())) / 1000;
                        } else {
                            //数值类型返回double类型的数字
                            //System.out.println(cell.getNumericCellValue()+":格式:"+cell.getCellStyle().getDataFormatString());
                            value = cell.getNumericCellValue();
                        }
                        break;
                    case XSSFCell.CELL_TYPE_BOOLEAN:
                        //布尔类型
                        value = cell.getBooleanCellValue();
                        break;
                    case XSSFCell.CELL_TYPE_BLANK:
                        //空单元格
                        break;
                    default:
                        value = cell.toString();
                }
                if (value != null && !value.equals("")) {
                    //单元格不为空,则加入列表
                    linked.add(value);
                }
            }
            if (linked.size()!= 0) {
                list.add(linked);
            }
        }
        return list;
    }
    /**
     * 要求excel版本在2007以上
     *
     * @param fileInputStream 文件信息
     * @return
     * @throws Exception
     */
    public static List<List<Object>> readExcel(FileInputStream fileInputStream) throws Exception {
        List<List<Object>> list = new LinkedList<List<Object>>();
        XSSFWorkbook xwb = new XSSFWorkbook(fileInputStream);
        // 读取第一张表格内容
        XSSFSheet sheet = xwb.getSheetAt(1);
        XSSFRow row = null;
        XSSFCell cell = null;
        for (int i = (sheet.getFirstRowNum() + 1); i <= (sheet.getPhysicalNumberOfRows() - 1); i++) {
            row = sheet.getRow(i);
            if (row == null) {
                continue;
            }
            List<Object> linked = new LinkedList<Object>();
            for (int j = row.getFirstCellNum(); j <= row.getLastCellNum(); j++) {
                Object value = null;
                cell = row.getCell(j);
                if (cell == null) {
                    continue;
                }
                switch (cell.getCellType()) {
                    case XSSFCell.CELL_TYPE_STRING:
                        value = cell.getStringCellValue();
                        break;
                    case XSSFCell.CELL_TYPE_NUMERIC:
                        if ("yyyy\"年\"m\"月\"d\"日\";@".equals(cell.getCellStyle().getDataFormatString())) {
                            //System.out.println(cell.getNumericCellValue()+":日期格式:"+cell.getCellStyle().getDataFormatString());
                            value = DateUtils.getMillis(HSSFDateUtil.getJavaDate(cell.getNumericCellValue())) / 1000;
                        } else {
                            //System.out.println(cell.getNumericCellValue()+":格式:"+cell.getCellStyle().getDataFormatString());
                            value = cell.getNumericCellValue();
                        }
                        break;
                    case XSSFCell.CELL_TYPE_BOOLEAN:
                        value = cell.getBooleanCellValue();
                        break;
                    case XSSFCell.CELL_TYPE_BLANK:
                        break;
                    default:
                        value = cell.toString();
                }
                if (value != null && !value.equals("")) {
                    //单元格不为空,则加入列表
                    linked.add(value);
                }
            }
            if (linked.size()!= 0) {
                list.add(linked);
            }
        }
        return list;
    }

    /**
     * 导出excel
     * @param excel_name 导出的excel路径(需要带.xlsx)
     * @param headList  excel的标题备注名称
     * @param fieldList excel的标题字段(与数据中map中键值对应)
     * @param dataList  excel数据
     * @throws Exception
     */
    public static void createExcel(String excel_name, String[] headList,
                                   String[] fieldList, List<Map<String, Object>> dataList)
            throws Exception {
        // 创建新的Excel 工作簿
        XSSFWorkbook workbook = new XSSFWorkbook();
        // 在Excel工作簿中建一工作表,其名为缺省值
        XSSFSheet sheet = workbook.createSheet();
        // 在索引0的位置创建行(最顶端的行)
        XSSFRow row = sheet.createRow(0);
        // 设置excel头(第一行)的头名称
        for (int i = 0; i < headList.length; i++) {

            // 在索引0的位置创建单元格(左上端)
            XSSFCell cell = row.createCell(i);
            // 定义单元格为字符串类型
            cell.setCellType(XSSFCell.CELL_TYPE_STRING);
            // 在单元格中输入一些内容
            cell.setCellValue(headList[i]);
        }
        // ===============================================================
        //添加数据
        for (int n = 0; n < dataList.size(); n++) {
            // 在索引1的位置创建行(最顶端的行)
            XSSFRow row_value = sheet.createRow(n + 1);
            Map<String, Object> dataMap = dataList.get(n);
            // ===============================================================
            for (int i = 0; i < fieldList.length; i++) {

                // 在索引0的位置创建单元格(左上端)
                XSSFCell cell = row_value.createCell(i);
                // 定义单元格为字符串类型
                cell.setCellType(XSSFCell.CELL_TYPE_STRING);
                // 在单元格中输入一些内容
                cell.setCellValue((dataMap.get(fieldList[i])).toString());
            }
            // ===============================================================
        }
        // 新建一输出文件流
        FileOutputStream fos = new FileOutputStream(excel_name);
        // 把相应的Excel 工作簿存盘
        workbook.write(fos);
        fos.flush();
        // 操作结束,关闭文件
        fos.close();
    }
}

<think> 我们正在讨论Apache POI的两个组件:poi-ooxmlpoi-ooxml-schemas。根据引用[1]和[2],我们可以得到以下信息: 1. poi-ooxml-lite是Apache POI处理新版Office文件格式(如.xlsx, .pptx, .docx)的基础支撑,它提供了核心的XML模式定义。在POI 5.0.0之前,这个角色是由poi-ooxml-schemas担任的。从5.0.0开始,poi-ooxml-lite取代了poi-ooxml-schemas。 2. 通常,我们在项目中引入poi-ooxml(高版本)时,Maven或Gradle会自动处理传递依赖,包括poi-ooxml-lite。因此,我们不需要单独引入poi-ooxml-schemas。 3. 需要注意的是,如果项目中还有其他依赖使用了旧版的poi-ooxml-schemas,可能会引起冲突。解决方法如引用[3]所示,排除掉旧版的poi-ooxml-schemas。 4. 引用[2]提到,POI库用于处理Office文档,包括生成报告、数据导入导出等。 5. 引用[4]展示了使用POI读取Excel单元格内容的代码示例,这属于POI的具体应用。 现在,用户想要获取poi-ooxmlpoi-ooxml-schemas的详细介绍。 根据上述信息,我们可以这样组织回答: - 先介绍poi-ooxml:它是一个用于读写Office Open XML(OOXML)格式文件(如Excel的.xlsx)的Java库。它依赖于poi-ooxml-lite(在5.0.0之前是poi-ooxml-schemas)来提供XML模式定义。 - 再介绍poi-ooxml-schemas:在POI 5.0.0之前,它包含了完整的OOXML模式定义(XSD文件),用于解析和生成OOXML文档。由于它非常大(几十MB),所以从5.0.0开始,POI团队将其替换为poi-ooxml-lite,后者只包含必要的模式定义,体积更小。 - 强调现在(5.0.0及以上版本)应该使用poi-ooxml-lite,而不再使用poi-ooxml-schemas。 - 关于依赖冲突的解决方法。 此外,我们还可以提到: - poi-ooxmlPOI项目的一部分,POI项目还包含其他组件,如poi(处理旧版Office格式,如.xls)等。 由于用户要求详细介绍,我们可以分点说明。 注意:回答中引用的部分末尾要自然地添加引用标识,如[^1]。 </think> ### Apache POI 组件详解:`poi-ooxml` 与 `poi-ooxml-schemas` #### 1. **poi-ooxml** **核心功能**: - 📌 **OOXML 文档处理引擎**:实现对 `.xlsx` (Excel)、`.docx` (Word)、`.pptx` (PPT) 等 Office Open XML 格式的读写操作[^2] - 📦 **依赖结构**: ```mermaid graph TD poi-ooxml --> poi-ooxml-lite <!-- 5.0+ 版本 --> poi-ooxml --> poi poi-ooxml-lite --> XMLBeans <!-- XML 解析核心 --> ``` - 🔧 **核心接口**: ```java // Excel 文件读写示例 XSSFWorkbook workbook = new XSSFWorkbook(); // 创建 .xlsx 文件 XSSFSheet sheet = workbook.createSheet("Data"); // 创建工作表 XSSFRow row = sheet.createRow(0); row.createCell(0).setCellValue("POI-OOXML Demo"); // 写入数据 ``` **适用场景**: - 动态生成 Excel 报表 - 解析用户上传的 Word/PPT 文档 - 批量处理 Office 文档数据[^2] --- #### 2. **poi-ooxml-schemas** **历史定位**: - 🧩 **XML 模式定义库**:包含完整的 OOXML 规范 XML Schema(3000+ XSD 文件) - ⚖️ **体积问题**:完整库约 20MB(POI 4.x 及更早版本) - 🔄 **版本演进**: | POI 版本 | 组件变更 | |------------|------------------------| | ≤ 4.1.2 | poi-ooxml-schemas | | ≥ 5.0.0 | **poi-ooxml-lite** 替代 | **核心作用**: - 📐 提供 Office 文档结构的 XML 元数据约束 - 🔍 支持 XMLBeans 解析 OOXML 底层格式 - ⚠️ **典型冲突场景**(需依赖排除)[^3]: ```xml <dependency> <groupId>org.example</groupId> <artifactId>problematic-lib</artifactId> <exclusions> <exclusion> <groupId>org.apache.poi</groupId> <artifactId>poi-ooxml-schemas</artifactId> </exclusion> </exclusions> </dependency> ``` --- #### 3. **关键技术对比** | 维度 | poi-ooxml | poi-ooxml-schemas (旧版) | |--------------------|-------------------------------|----------------------------| | **组件类型** | 功能实现层 | 规范定义层 | | **文件大小** | ≈ 3MB (含传递依赖) | ≈ 20MB (仅自身) | | **POI 5.0+ 状态** | ✅ 主力组件 | 被 poi-ooxml-lite 替代 | | **是否需直接引用** | ✅ 项目必须引入 | ❌ 禁止显式引入 | > 💡 **最佳实践**:使用 POI 5.0+ 时,只需声明 `poi-ooxml` 依赖,其自动引入轻量级 `poi-ooxml-lite`(约 5MB),无需处理原始 schemas 包[^1]。 --- #### 4. **典型应用场景** **Excel 数据读取**(结合 `poi-ooxml`)[^4]: ```java // 读取单元格数据(兼容新旧格式) String readCell(Cell cell) { return switch (cell.getCellType()) { case STRING -> cell.getStringCellValue(); // 文本 case NUMERIC -> DateUtil.isCellDateFormatted(cell) ? // 日期判断 new DateTime(cell.getDateCellValue()).toString() : String.valueOf(cell.getNumericCellValue()); case BOOLEAN -> String.valueOf(cell.getBooleanCellValue()); default -> ""; }; } ```
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值