批量处理文件名称(上)

批量处理文件名称(上)

简介:python小白今天,对于五行代码实现一个Python办公自动化小案例分析,让我们迅速get实用技能。

案例描述(本段快速浏览也可)

你在办公中可能也遇到过需要提取某文件夹下文档名称的情况。当文档数量较少时,可以通过手动来整理,但如果经常需要处理这类工作,或者文档数量很大时,就十分耗费时间了。
现在有一个任务需要在文件夹下众多的文档中整理出PDF格式的文献资料,并提取名称表保存到表格文件,用作资料整理。

在这里插入图片描述
**废话不多说,**今天开始,就正式进入Python实操内容的学习,手把手带你掌握一个又一个实用的小项目,在日常也能自己动手应用。

思路分析:

1. 导入模块:

导入过程中所需要用到的模块

2. 获得文件路径:

需要获取相应文件名所对应的文件夹路径

3.获取文档名称

使用模块中的方法获得文件的名称

4. 循环打印

注:完成这四步获取文件名称,只需要如下5行代码:

import os
path='对于文件夹路径'  #如我的路径是path='D:/课程/python/资料夹' 
name=os.listdir(path)
for i in name:
    print(i)

如果你是门新,你就会上述代码的作用及其意义产生疑问,别急,现在马上进入代码解读环节~

- 导入模块:

python之所以如此流行,一个重要的原因是他有成千上万的模块来支撑,省去很多麻烦的代码输入操作。

各种神奇的模块中存放了各式各样方法,将这些模块导入程序中,就能直接运用其中的方法解决问题,省去了自己辛苦钻研找对策的时间,避免重复造轮子。
导入的方法就是使用import+模块名,看下面的代码:

import os	#导入模块,import可以理解为导入的意思,os为模块名

通过上面的代码成功导入了os模块。os模块中有各种处理文件和目录的方法。

如果你已经完成了代码的输入与代码的含义的理解,就可以进入下一步啦~

- 获得文件路径:

想要得到文件夹下的文档名,当然要锁定文件夹的位置信息,存储在计算机里的信息那么多,如何精确定位呢?
就好像朋友们要去你家为你庆祝生日,首先需要知道你的街道小区门牌号一样。使用计算机时要找到文件就必须知道文件的位置,而表示文件位置的方式就是路径。
在下图中的位置可以复制得到路径信息:

在这里插入图片描述
文件夹的路径可能是这么长的一串内容:D:/课程/python/资料夹

那当写程序的时候要用到路径,每次都要敲这么长的一串内容吗?
下面为你介绍今天第一个语法知识点:变量

变量

我们怎么能允许这看起来这么无脑繁杂的情况出现,现在就为你介绍变量这个重量级嘉宾!
为了方便同一个内容在程序里多次出现时能更方便地获取,需要将它赋值给一个变量。
变量就类似起了个小名,例如你的大名叫做张二虎,妈妈给你起了个小名叫贝贝,‘贝贝起床收拾屋子!’和‘张二虎起床收拾屋子!’说的都是你,小名还更简单好记。
变量赋值需要用到等于号=,等号左边为变量名,右边为需要存储的内容。
现在我们就可以把文件夹路径赋值给一个变量,起名为path:

#指定文件夹的路径
path='D:/课程/python/资料夹'

现在就得到了文件夹的路径,并把它存放在变量path中。

-获取文档名称

如何得到路径下所有的文档名称呢?这看起来是一个复杂又让人头大的问题。
别忘了我们前面导入的模块,里面有各种神奇的方法,不如现在就从多啦A梦的神奇口袋中拿出个道具帮助我们。
前面导入的os模块中就有方法来实现文件和目录的处理。
那么有了方法我们应该如何应用?马上跟我来学习今天第二个语法知识点。

方法:

下面要用到获取文档名称功能的方法长这样子:listdir()
listdir就是这个方法的名字,代表它的功能是得到某路径下的所有文档名称。

可以看到方法名称后面跟着一个括号,具体获取的是哪个路径下的内容,就需要在括号中把路径传递给这个方法。

括号中的内容就是参数。

需要某个功能的时候只需把必要的参数放进括号中,我们不用去深究计算机是怎么通过一系列复杂操作完成的,只要关心最终结果就ok啦。

来看下面这行代码:

#读取文件夹下的文档名称
name=os.listdir(path)	
#os.listdir()这样表示的原因因为listdir为os模块中导入的一个方法故而用一个“.”连接

文件夹的路径在上一步中已经赋值给了path这个变量,所以这里我们传入的参数可以直接写变量名path。

其实在这里写作name=os.listdir(path)
和name=os.listdir(‘D:/课程/python/资料夹’)
表达的是相同的意思。

相信你现在可以看懂,我们将得到的所有文档名称又存放进了name这个变量中。

-循环打印

上一步中,完成了收集所有文档名称的工作,现在它们都被储存在name中。然而……虽然知道它存放进去了,但这结果看不见摸不着的,怎么证明真的实现了效果呢?

我们可以将name中的文档名称打印呈现出来检验查看一下~这里就需要用到Python中的循环语句。

循环

上一步中,完成了收集所有文档名称的工作,现在它们都被储存在name中。然而……虽然知道它存放进去了,但这结果看不见摸不着的,怎么证明真的实现了效果呢?

我们可以将name中的文档名称打印呈现出来检验查看一下~这里就需要用到Python中的循环语句。
在这里插入图片描述
写一个for循环来解决,格式为:

for 元素 in 序列:
执行的操作

计算机就会帮我们逐一取出序列中的每项内容,执行冒号后的操作。
把循环的语法格式套用在今天的案例中,需要把元素,序列,执行的操作这三项内容补齐。

元素:我们可以用i来代替,表示取出的每一项数据内容;

序列:代表数据存放的地方,本例中,文档名都存储在name中;

执行的操作:打印文档名。
打印功能需要用到我们上节课学习的print()语句,下面来用循环完成操作:

本次对应代码:

for i in name:		#循环(for,while等)条件(if,elif,else)后都需要加“:”
    print(i)		#print()前需要一个tap否者会产生错误

在这里插入图片描述
打印完成。成功得到文件夹中的所有文件名称

现在完整看一下今天的代码,自己是不是已经能理解其中的逻辑了~

#导入所需要的库,os 模块提供了非常丰富的方法用来处理文件和目录
import os 
#指定文件夹的路径
path='D:/课程/python/资料夹'
#读取文件夹下的文档名称
name=os.listdir(path)
#循环打印文档名称
for i in name:
    print(i)

总结

今天分享,我们经过下面四个步骤

导入模块
得到文件夹路径
获取文档名称
循环打印文件名
完成了提取路径下所有文档名称的任务。
还学习掌握了四个语法知识点,现在来回顾一下。
1、 模块

Python中有各种神奇的模块,它们各自有不同功能,各模块中存放了许多方法。将这些模块导入程序中,就能直接运用里面的方法解决问题。省去了自己辛苦钻研找对策的时间,避免重复造轮子。
2、 变量

使用等号=赋值,等号左边是变量名,右边是需要存储的内容。
3、方法

可以为它传入不同参数,需要用某个功能的时候不必了解内部细节,只关注输入输出就好。
4、循环
循环是指把一件事重复执行多次,计算机能高效准确地完成枯燥的重复性工作。for循环的格式为:
for 元素 in 序列:

师承Python学习联盟

如对python语言有兴趣可以微信关注Python学习联盟

希望本次分享能对您有所帮助!!!
最终版权归Python学习联盟所有。

																		——一个热爱Python的学习崽
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值