python遍历文件夹的方法os.walk()

本文介绍Python中os.walk函数的使用方法,详细解释了如何利用此函数遍历目录结构,并获取所有子目录及文件名。同时,文章还介绍了生成器的概念及其在Python中的应用。

使用os.walk函数:

 for path, dirNames, _ in os.walk(dataDir):
            for dirName in dirNames:
                if dirName=="train":
                    # trainDir = os.path.join(path, dirName)
                    for trainDir, _, trainImgNames in os.walk(os.path.join(path, dirName)):
                        for trainImgName in trainImgNames:
                            imgData.append(os.path.join(trainDir, trainImgName))

os.walk返回一个元组有三个参数,第一个是遍历的文件夹路径,第二个是所有的子文件夹名,第三个是所有的子文件名。需要完整的路径的话可以用os.path.join()连接。

os.walk返回值大致是这样的:

  if topdown:
        yield top, dirs, nondirs

注意:os.walk是以yield生成器函数方式返回的这个tuple,是一个迭代器,需要放到for循环里面遍历使用,直接使用_, _, fileNames = os.walk(path)这种方式是获得不到的。

yield的作用:返回一个可以用来迭代(for循环)的生成器,它的应用场景通常为一个需要返回一系列值的,含有循环的函数中。

①迭代器迭代器有两个基本的方法:创建迭代器iter() 和 访问迭代器next()。

可以直接作用于for循环的对象统称为可迭代对象:Iterable

一类是集合数据类型,如list、tuple、dict、set、str等;

一类是generator,包括生成器和带yield的generator function

迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。

②生成器

如果列表元素可以按照某种算法推算出来,可以在循环的过程中不断推算出后续的元素,这样就不必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,称为生成器:generator。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值