java 读取word文件

这篇博客展示了如何使用Apache POI库在Java中读取Word文档。通过创建`FileInputStream`实例,加载`POIFSFileSystem`,然后使用`HWPFDocument`解析文档。博主遍历了文档中的表格,逐行逐列提取每个单元格的文本内容,并对内容进行处理,例如替换特定字符。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

package com.example;


import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.usermodel.*;
import org.apache.poi.poifs.filesystem.POIFSFileSystem;

import java.io.FileInputStream;

public class wordPdf {

    public static void main(String[] args) {
        try{
            FileInputStream in = new FileInputStream("/Users/wangrongfei/Downloads/中国标准文献分类号CCS.doc");// 载入文档
            POIFSFileSystem pfs = new POIFSFileSystem(in);
            HWPFDocument hwpf = new HWPFDocument(pfs);
            Range range = hwpf.getRange();// 得到文档的读取范围
            TableIterator it = new TableIterator(range);
            String[] stu = new String[5];
            // 迭代文档中的表格
            while (it.hasNext()) {
                Table tb = (Table) it.next();
                // 迭代行,默认从0开始
                for (int i = 0; i < tb.numRows(); i++) {
                    TableRow tr = tb.getRow(i);
                    // 迭代列,默认从0开始
                    for (int j = 0; j < tr.numCells(); j++) {

                        TableCell td = tr.getCell(j);// 取得单元格
                        // 取得单元格的内容
                        String s = "";
                        for (int k = 0; k < td.numParagraphs(); k++) {
                            Paragraph para = td.getParagraph(k);// 获取第k个段落
                            s += para.text();
                            System.out.println(s);
                        }
                        s = s.replace("•", "");
                        stu[j] = s;

                        // end for
                    }// end for

                }
            }
        }catch (Exception e){

        }
    }
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值