关于Python使用pdfminer对PDF文件中三线表中直线的识别,并返回相应的Y轴坐标
关于Python使用pdfminer库对PDF文件三线表中直线的识别,并返回相应的Y轴坐标依赖库测试文件实现目标识别原理介绍1. 全部解析2. 直线对象获取3. 直线过滤具体代码LTRect对象介绍可能存在的问题最终效果
参考文章:
pdfminer官方文档
pdfminer源码
依赖库
pdfminer
测试文件
pdf文件一整页
实现目标
获取所有直线对象,并获得其相应的Y轴坐标(5张表,共15条直线)
识别原理介绍
1. 全部解析
利用pdfminer库能获取单页PDF页面中的所有对象:包括
原创
2020-07-07 23:15:01 ·
3312 阅读 ·
5 评论