- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 python识别新版发票内容并改名(兼容旧版发票)
摘要 该Python脚本用于自动识别和重命名电子发票PDF文件,兼容新旧版本发票格式。主要功能包括: 通过PyMuPDF库解析PDF内容,定位关键信息(发票号、买方、卖方、总金额等) 自动判断发票类型(新版/旧版) 按标准格式重命名发票文件(包含日期、金额等信息) 支持绘制调试矩形框以验证识别区域 批量处理当前文件夹中的所有PDF发票文件 代码采用坐标定位方式避免关键字识别的不稳定性,特别解决了不同省份发票格式差异问题。使用前需安装PyMuPDF库,将脚本与发票文件放在同一目录运行即可。
2025-06-20 13:03:47
144
原创 python 提取pdf格式电子发票并改名
经过多次研究使用pymupdf读取pdf格式,但是不同省份和城市开出的电子发票细节格式并不相同,最终是按区域先读取再细分信息。本人小公司企业主一枚,经常接受电子发票,然后有空发给会计,默认的发票基本都是发票号,看不出是哪个公司开的,哪个公司收的。读取多数信息了,至于改名规则可以根据喜好修改。如果有相同的发票会在重复的文件前面加上下划线。python 3.7 及fitz pymupdf ver =1.18.14下运行。......
2022-08-03 17:18:17
3283
10
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人