用Python实现pdf读取数据填入Excel

yangwj211

已于 2024-03-04 12:51:49 修改

阅读量1k

点赞数 5

CC 4.0 BY-SA版权

分类专栏： intern 文章标签： python pdf excel

于 2024-02-27 13:18:03 首次发布

本文链接：https://blog.youkuaiyun.com/yangwj211/article/details/136319509

一、使用pdfplumber截取pdf文档中的信息

import pdfplumber
import pandas as pd

# 读取PDF文件中的信息
with pdfplumber.open("FS.pdf") as pdf:
    page01 = pdf.pages[1]  # 指定页码
    text = page01.extract_text()
    holdings_index1 = text.index('Top')
    holdings_index2 = text.index('The information provided')
    holdings = text[holdings_index1:holdings_index2]
    holdings_no_title = holdings.replace('Top 10 Holdings', '')
    holdings_splited = holdings_no_title.split('\n')

    holding_name = []
    holding_data = []
    for i in range(1, 11):
        data = holdings_splited[i][-5:]
        name = holdings_splited[i][0:-6]
        holding_data.append(data)
        holding_name.append(name)

二、读取excel文件中的数据

xls = pd.ExcelFile('GreatLink_Top_10_holdings.xlsx')
sheets = {}

使用 pd.ExcelFile('GreatLink_Top_10_holdings.xlsx') 创建一个 ExcelFile 对象。这个对象表示待读取的

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

yangwj211

关注关注

5
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【Python学习】办公自动化-批量读取PDF中的表格到Excel文档

u014481728的博客

10-13

3410

批量读取PDF中的表格到Excel文档：使用python批量读取PDF中的表格数据并写入Excel文档使用os、pdfplumber、openpyxl模块实现

Python提取PDF中的表格写入Excel

weixin_42636075的博客

04-02

767

Python提取PDF中的表格写入Excel

参与评论您还未登录，请先登录后发表或查看评论

python读取pdf内容写入到Excel表格中

arron_12的博客

09-07

1168

读取文件夹中的所有 PDF 文件。提取每个 PDF 文件的全文内容。创建一个新的 Excel 表格或使用现有的表格。将提取的内容粘贴到表格中，每个 PDF 的内容放在一个垂直单元格中。保存表格文件。以上代码可以帮助你从 PDF 文件夹中提取内容并将其导出到一个 Excel 文件中，每个 PDF 的内容放在 Excel 文件的一列中，方便进一步处理和分析。

【Python】操作PDF文件

最新发布

宅男很神经

05-25

970

好的，我们继续以以前所未有的深度和广度，剖析 Python。在之前关于网络编程等主题的基础上，我们将转向处理日常工作中非常常见的文档格式：PDF。本文将专注于 Python 操作 PDF 文件，深入其核心库的内部机制、高级应用、潜在的运维精髓以及在复杂真实场景中的应用之道，力求达到信息量和深度的极致，并辅以大量详尽的代码示例，代码旁边必须要有中文解释，没有任何废话和总结语句，确保内容量充足且深入，直至达到我能够生成的最大字数限制。Python 操作 PDF 文件：深度解析与实践PDF (Portable D

运用Python抓取PDF表格中的特定数据并生成Excel文件

penpen99313的博客

07-28

2194

在工作中遇到了一个问题，需要把PDF中的地方债数据粘贴到Excel表格中，在PDF的每个表格中需要找到“金额”“本息和”“项目总收益”“项目名称”“项目类型”……等等数据。每一页表格需要复制粘贴十次，一共四百多页的PDF岂不是要复制粘贴八千次！眼瞎了都粘不完吧！于是我开始尝试用Python来读取PDF表格，然后找到每个表格对应位置的数据，对应到新生成的序列中，最后导出为Excel。如图一，这是PDF中每一页记录的地方债项目数据。

Python提取PDF文件表格数据至Excel

m0_67335157的博客

07-26

380

Python提取PDF文件表格数据至Excel

Python自动化办公：批量提取PDF中的表格到Excel

2301_76419561的博客

10-08

2568

通过Python的ospdfplumber和openpyxl模块，我们可以轻松实现批量提取PDF中的表格数据，并将其写入Excel文件。这一自动化流程不仅提高了工作效率，还减少了人为错误。对于需要处理大量PDF文件的办公人员来说，这一技能无疑将大大节省时间和精力。

用Python提取PDF表格到Excel文件

Eiceblue的专栏

09-24

1360

本文演示如何使用Python提取PDF文档表格数据到Excel文件中。

python读取pdf并写入excel_Python读取pdf表格写入excel代码方法

weixin_39551996的博客

01-30

587

本篇文章小编给大家分享一下Python读取pdf表格写入excel代码方法，文章代码介绍的很详细，小编觉得挺不错的，现在分享给大家供大家参考，有需要的小伙伴们可以来看看。避免CV大法pdf 文件的表格的数据可以复制，但是这是一项非常繁琐的事情。所以我首先考虑的是，Python 可否帮助我们高效且规范地读取 pdf 中的表格数据。所以一顿的检索，发现了一个比较优质处理 pdf 的库：pdfplumb...

Python 提取PDF表格数据并保存到TXT文本或Excel文件

nuclear2011的博客

05-15

2005

本文介绍了如何使用Python读取PDF表格数据，并保存到TXT文本文件和Excel表格。包含详细的步骤介绍和代码示例。

Python批量提取PDF表格并保存为Excel

weixin_68789096的博客

08-22

3119

想要提取 PDF 的数据，保存到 Excel 中。虽然是可以直接利用 WPS 将 PDF 文件输出成 Excel，但这个功能是收费的，而且如果将大量 PDF转 Excel 的时候，手动去输出是非常耗时的。我们可以利用 Python 的第三方工具库 pdfplumber 快速完成这个功能。

python实现PDF中表格转化为Excel的方法

09-16

主要为大家详细介绍了python实现PDF中表格转化为Excel的方法，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下

Python从PDF中提取表格

01-04

使用Python的pdfplumber模块从PDF指定的各个页面中提取对应的表格，全部存入pandas的DataFrame中。将表格中不关注的行列删除后，保存到Excel电子表格中。源码将STM32规格书中指定封装的引脚表提取到Excel中，方便不同型号芯片的引脚兼容性检查。

Python 处理PDF表格：抓出PDF中的内容保存到本地Excel中

Katherine1029的博客

08-04

1047

pip install pdfminer.six#这个是Python3要用到的pdf转化TXT pip install pdfminer3k#这个是Python2要用到的pdf转化TXT pip install pdfplumber#这个是Python2要用到的pdf转化excel

Python操作pdfplumber读取PDF写入Excel

醉蕤的博客

08-11

4406

Python操作pdfplumber读取PDF写入Excel

如何使用python抽取pdf表格及文本，并保存到excel

分享Python、数据分析、人工智能前沿知识

08-14

1264

前面已经介绍过pdfplumber的功能，也用一个小案例展示了如何提取表格，我觉得对于pdfplumber只需要了解三点就可以。1、它是一个纯python第三方库，适合python 3.x版本2、它用来查看pdf各类信息，能有效提取文本、表格3、它不支持修改或生成pdf，也不支持对pdf扫描件的处理Github地址。

Python提取PDF表格及文本！（附源码）

【优快云官方推荐】

03-02

2086

前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。 PS：如有需要Python学习资料的小伙伴可以点击下方链接自行获取 Python免费学习资料、代码以及交流解答点击即可加入 pdf是一种便携式文档格式，由Adobe公司设计。因为不受平台限制，且方便保存和传输，所以pdf非常受欢迎。目前市场上有很多pdf工具，大部分是阅读类，也有支持对pdf的修改、转换等功能，但这部分工具不少是收费的。但是如果要批量对pdf修改的话还是用代码实现会比较好！

Python提取pdf表格至excel文件

weixin_44500833的博客

07-17

798

功能介绍：提取pdf文件中的表格数据到excel文件中视频演示： Python 将pdf表格转换为excel表格界面：轮子文件大小 pdfplumber 核心code： def extract_table(pdf_file): fn = pdf_file[pdf_file.rfind('\\') + 1: -5] wb = Wor

Python 操作pdf文件(pdfplumber读取PDF写入Excel)

感谢关注-最近在编写开源的自动化测试框架还没整理完

08-11

6608

Python 操作pdf(pdfplumber读取PDF写入Exce) Python读取pdf文件存入Excel