poi XWPFDocument 读取word文档
一、pom.xml文件引入 poi 依赖
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-ooxml</artifactId>
<version>4.0.1</version>
</dependency>
二、直接上代码
要读取的word内容如下:

代码:
public static void main(String[] args) throws Exception{
//本地文档地址
InputStream is = new FileInputStream("D:\\table.docx");
XWPFDocument doc = new XWPFDocument(is);
//获取所有的段落信息
List<XWPFParagraph> paras = doc.getParagraphs();
for (XWPFParagraph para : paras) {
//对齐方式 alignment 枚举值
ParagraphAlignment alignment = para.getAlignment();
//获取段落所有的文本对象
List<XWPFRun> runs = para.getRuns();
//文本的颜色 color
String color = runs.get(0).getColor();
//文本 大小 fontSize
int fontSize = runs.get(0).getFontSize();
//文本 类型 fontFamily
String fontFamily = runs.get(0).getFontFamily();
//输出内容
System.out.println(para.getText());
}
//获取文档中所有的表格
List<XWPFTable> tables = doc.getTables();
//所有行
List<XWPFTableRow> rows;
//所有单元格
List<XWPFTableCell> cells;
for (XWPFTable table : tables) {
//表格属性
CTTblPr tbl = table.getCTTbl().getTblPr();
CTTblWidth tblW = tbl.getTblW();
STTblWidth.Enum type = tblW.getType();
String w = tblW.getW().toString();
System.out.println("表格宽度"+w);
//第一行 第二行下标1、、、
XWPFTableRow row1 = table.getRow(0);
//单元格内容
String text = row1.getCell(0).getText();
//单元格高度
int height = row1.getHeight();
CTTcPr tcPr = row1.getCell(0).getCTTc().getTcPr();
STTblWidth.Enum type1 = tcPr.getTcW().getType();
//单元格宽度
String row1with = tcPr.getTcW().getW().toString();
System.out.println("日期:"+text+"高度"+height+"宽度"+row1with+"类型"+type1);
//获取表格对应的行
rows = table.getRows();
for (XWPFTableRow row : rows) {
//获取行对应的单元格
cells = row.getTableCells();
for (XWPFTableCell cell : cells) {
System.out.println(cell.getText());;
}
}
}
is.close();
}
本文介绍了如何通过Apache POI库读取Word文档中的段落和表格信息,包括文本样式、颜色、字体大小等,并展示了如何遍历和提取表格的内容。
5000

被折叠的 条评论
为什么被折叠?



