减少用户工作量及误操作的可能性,需要实现用户上传PDF格式的发票,系统通过解析PDF文件获取发票内容,并直接将其写入表单。以下文章记录了功能实现的代码。
发票样式
发票内容解析
引用Maven
使用pdfbox
xml
<dependency>
<groupId>org.apache.pdfbox</groupId>
<artifactId>pdfbox</artifactId>
<version>2.0.24</version> <!-- 请检查最新版本 -->
</dependency>
获取PDF内容
设置 sortByPosition 为 true 可以按文本位置提取内容,否则获取到的内容错乱,无法获取到真正需要的内容
@RequestMapping("uploadReceiptsTest")
@ResponseBody
public Map<String,String> uploadReceiptsTest() throws Exception{