Python遍历文件夹

本文介绍了在Python中如何遍历文件夹及其子文件夹,特别是在处理大量文本文件时的实用方法,包括判断文件和目录是否存在。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近做文本聚类要扫描大量的文本,因此,需要遍历文件夹和子文件夹下面的大量文件,记录一下python是如何实现的。


# python遍历文件夹内所有文件,返回文件名即后缀
import os
for filename in os.listdir(r'/Users/John/Documents/NLPStudy/tc-corpus-train/C3-Art/'):
    print filename

import glob # 可以设置文件过滤,输出为文件路径
for filename in glob.glob('/Users/John/Documents/NLPStudy/tc-corpus-train/C3-Art/*.txt'):
    print filename
print '\n\n\n\n'

import os.path # 可以访问子文件夹,只返回文件名及后缀
def processDirectory(args, dirname, filenames):
    print 'Directory', dirname
    for filename in filenames:
        print 'File', filename
os.path.walk(r'/Users/John/Documents/NLPStudy/tc-corpus-train/', processDirectory, None)

第三种方法可以遍历子文件夹,减少代码量,第二种方法可以输出全部的文件路径比较方便,自己取舍着用吧,里面的路径改成你自己的路径就可以了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值