python--内建os.walk遍历目录

python 提供了一个很方便的内建函数,用于实现目录的遍历。下面我们根据简单实例来看下os.walk的用法


1.  这是我测试时模拟的路径结构,主目录walkdir , 子目录是testdir1 ,testdir2 ,同时testdir1 目录下还有1个它的子目录 testdir3,3个文件aaa ,bbb, ccc 分别放于testdir1-3

[root@localhost ~]# tree walkdir/
walkdir/
├── testdir1
│   ├── aaa
│   └── testdir3
│       └── ccc
└── testdir2
    └── bbb

3 directories, 3 files
2. 调用os.walk()打开某个路径时,返回的会是1个递归的列表,假设为S  . S[0] 代表当前路径,S[1] 代表该路径下的子目录,S[2],则当前路径或子目录下的文件。更形象的我们看下面例子:

>>> for s in os.walk('/root/walkdir'):
...       print s
... 
('/root/walkdir', ['testdir2', 'testdir1'], [])
('/root/walkdir/testdir2', [], ['bbb'])
('/root/walkdir/testdir1', ['testdir3'], ['aaa'])
('/root/walkdir/testdir1/testdir3', [], ['ccc'])
3. 如此,我们就可以根据我们实际需要,看是递归取目录,或是文件名,操作也很简单

>>> for fpath, fdir, fname in os.walk('/root/walkdir'):
...            print fpath
... 
/root/walkdir
/root/walkdir/testdir2
/root/walkdir/testdir1
/root/walkdir/testdir1/testdir3
>>> for fpath, fdir, fname in os.walk('/root/walkdir'):
...            print fdir
... 
['testdir2', 'testdir1']
[]
['testdir3']
[]
>>> for fpath, fdir, fname in os.walk('/root/walkdir'):
...            print fname
... 
[]
['bbb']
['aaa']
['ccc']






### 使用 `os.walk` 遍历目录及其所有子目录 Python 中的 `os.walk()` 函数能够以递归方式遍历指定目录及其所有子目录。以下是具体实现方法及相关说明。 #### 1. 基础语法 `os.walk(top, topdown=True, onerror=None, followlinks=False)` 是一个生成器函数,返回三元组 `(root, dirs, files)`,其中: - `root`: 当前正在遍历目录路径。 - `dirs`: 列表形式,表示当前目录下的所有子目录名称。 - `files`: 列表形式,表示当前目录下的所有文件名称[^1]。 默认情况下,`topdown` 参数为 `True`,意味着先访问父目录再进入子目录;将其设为 `False` 可反转此行为[^4]。 --- #### 示例代码 以下代码展示了如何使用 `os.walk` 遍历目录 `/` 和其所有子目录,并打印每个目录中的文件和子目录信息: ```python import os # 定义要遍历的根目录 root_directory = "/" try: # 开始遍历 for root, dirs, files in os.walk(root_directory, topdown=True): print(f"当前目录: {root}") # 打印当前目录路径 print(f"子目录列表: {dirs}") # 打印当前目录下的子目录 print(f"文件列表: {files}\n") # 打印当前目录下的文件 except PermissionError as e: print(f"权限错误: {e}. 您可能没有足够的权限访问某些目录或文件.") except FileNotFoundError as e: print(f"找不到路径: {e}. 请确认输入的根目录存在且有效.") ``` --- #### 特殊情况处理 ##### (1)排除特定目录 有时需要跳过一些不需要遍历目录(如隐藏目录)。可以通过修改 `dirs` 列表来实现这一点。例如,忽略名为 `.git` 或 `node_modules` 的目录: ```python for root, dirs, files in os.walk("/"): # 排除特定目录 dirs[:] = [d for d in dirs if d not in ['.git', 'node_modules']] print(f"当前目录: {root}") print(f"子目录列表: {dirs}") print(f"文件列表: {files}\n") ``` 这里的关键在于对 `dirs` 列表进行原地修改 (`dirs[:]`),从而影响后续迭代过程[^5]。 ##### (2)仅收集特定类型的文件 如果只想获取某类文件(如 `.txt` 文件),可以在循环中加入筛选逻辑: ```python text_files = [] for root, _, files in os.walk("/"): text_files.extend([os.path.join(root, f) for f in files if f.endswith(".txt")]) if text_files: print("找到的 .txt 文件:") for file in text_files: print(file) else: print("未发现任何 .txt 文件.") ``` --- #### 性能优化提示 对于大规模目录结构,`os.walk` 可能会消耗较多时间和内存。为了提高效率,可以考虑以下策略: - 设置合理的停止条件(如最大深度限制)。 - 结合异步编程技术减少阻塞时间。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值