系统开发遇到一个需求,将上传文档在线展示,最开始是依照其他部门开发的方法,将word内容转HTML保存在表中 ,直接读取展示;开发完成后测试发现,文档中包含的一些对勾、箭头灯特殊字符,转HTML将会报错,客户要求特殊字符必须要支持,所以又查了很多方法,应用以下方法进行了开发
此方法需要引入比较多jar包,并且有要求特定版本,缺点:速度慢些;只支持docx文档格式;依赖jar包如下:
代码如下:
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.InputStream;
import java.io.OutputStream;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import org.apache.commons.collections.MapUtils;
import org.apache.poi.xwpf.converter.core.utils.StringUtils;
import org.apache.poi.xwpf.converter.pdf.PdfConverter;
import org.apache.poi.xwpf.converter.pdf.PdfOptions;
import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.apache.poi.xwpf.usermodel.XWPFParagraph;
import org.apache.p