1.word结构
参考:java通过poi解析word入门_java poi word-优快云博客
word文档与xml关系_word文件是xml吧-优快云博客
word的主体结构是包括xml和一些的压缩文件,解压后的目录类似为:
主体是document.xml。
用poi框架操作word文档,类似dom编程。但是编程较繁琐,最好有一个初始word模板。
2.word文档基本标签操作
maven包:
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi</artifactId>
<version>5.2.3</version>
</dependency>
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-ooxml</artifactId>
<version>5.2.3</version>
</dependency>
这里只有基本操作,并没有对api深人了解。
2.1 word文档结构参考
文档内容
大致结构
文档由段落(XWPFParagraph)、表格(XWPFTable)、引注(XWPFSDT)组成的,表格中包含行(Row),行包含单元格(Cell)。cell有能包含表格和段落。所以文档是树结构。
2.2 document和body
有一个document标签和body标签。内容都在body标签中。
可能会有的需求:将多个word文档合并。底层也就是将多个文档的body标签里的内容合并。
目前还未找到好的解决办法。解决思路估计是将body标签中各个元素拷贝并添加在一起。
2.3 table
能创XWPFDocument.createTable()建表格,但是没样式。最好能复制一份模板中的表格再添加。
参考代码:
static public XWPFTable copyTable(XWPFDocument document , XWPFTable origin) throws XmlException, IOException {
CTTbl ctTbl = CTTbl.Factory.parse(origin.getCTTbl().newInputStream());
CTBody body = document.getDocument().getBody();
CTTbl ctTbl1 = body.insertNewTbl(body.getTblList().size());//先新建表格关联body
body.setTblArray(body.getTblList().size()-1,ctTbl);
XWPFTable xwpfTable = new XWPFTable(ctTbl1, document);
document.insertTable(document.getBodyElements().size(),xwpfTable);//关联表格
return xwpfTable;
}
这里参考了XWPFDocument.createTable()的写法,最后第二、三行代码如何去掉似乎也不影响生成word的内容?但可能无法取到封装类XWPFTable ,也就无法对表格进行操作,如创建行。
2.4 row
能调用table.createRow()创建行,但没样式。实际情况一个会在某一行下面创建样式一样的新行。需要注意需要先设置行内容,再调用table.addRow(newRow,pos+1)才能生效