- 博客(3)
- 收藏
- 关注
原创 Python医疗报告自动化提取:PDF批量下载与无框表格解析
本文介绍了使用Python进行批量下载和解析PDF文件的流程,主要分为三个步骤:批量下载PDF、扫描PDF提取数据、将数据写入表格。在批量下载PDF部分,使用Selenium库模拟浏览器操作,并解决了无法直接下载PDF的问题,通过提取Base64编码的PDF数据并解码保存。在解析PDF部分,使用camelot库识别无框线表格,并通过严格匹配的方法定位和提取有效数据。文章还详细介绍了如何配置关键词模板和存储提取的数据,为处理不同格式的PDF报告提供了灵活且可维护的解决方案。
2025-05-18 12:23:33
647
原创 个人家庭低成本 Home assistant 搭建手把手教学(一)
在拥有这些**玩客云(30左右)+8gU盘(2.0)+双公头(USB)数据线 或 USB to C(电脑需要有C口)**硬件之后,我们就可以开始刷入海纳思系统了以上就是玩客云刷入海纳思的总流程,接下来会更新docker安装以及Home assistant安装教程。
2024-04-11 17:32:55
13078
5
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人