(超简单)批处理PDF文件——PY

部署运行你感兴趣的模型镜像

超多pdf文件名整合到一个表格文件中

代码展示

import os
#加载os库,用于读取文件和目录
data = r'D:\迅雷下载\B题-特殊医学用途配方食品数据分析\数据\特医食品说明书'
#导入路径,保存到data变量中
pdf_file = []
#新建一个空列表,用于存储整合文件名
for file in os.listdir(data):
#for循环遍历,os.listdir(data)返回当前目录下的所有文件及子目录的名称列表
    if file.endswith('.pdf'):
        pdf_file.append(file)
        #判断:如果文件后缀名是.pdf,那就把它加入到列表的末尾位置

print(pdf_file)

保存为Excel文件

import pandas as pd

pdf_file = pd.DataFrame(pdf_file)

pdf_file.to_excel('pdf_file.xlsx', index=False)

 

…………我会陆续更新处理PDF内容的部分

 


我很乐于助人,也想要得到成长,如果看到这篇帖子的友友们有需要处理的数据,可以私信博主帮忙(点个小赞就好)

您可能感兴趣的与本文相关的镜像

Python3.10

Python3.10

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值