Python标准模块——glob

Python的glob模块用于搜索符合特定规则的文件路径,支持通配符*、?和[]。glob.glob()返回所有匹配的文件路径列表,而glob.iglob()则生成逐个匹配的文件路径。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

3、 glob

用于查找符合特定规则的文件路径,正则表达式可以使用三个匹配符:

  • *:可以匹配任意个字符
  • ?:匹配单个字符
  • []:匹配指定范围内的字符

glob.glob(path)
     参数:
         path:文件路径匹配规则,可以是绝对路径,也可以是相对路径
     返回:
         所有匹配的文件路径列表
     举例

import glob
L = glob.blob(r'E"\Picture\*\*.jpg')    

glob.iglob(path)
获取生成器,使用它可以逐个获取匹配的文件路径名。和glob.glob()的区别在于,glob.glob()一次获取所有的匹配路径,而glob.iglob()一次只获取一个匹配路径。
     举例

import glob
f = glob.iglob(r'../*.py') #generator
for py in f:
    print py
### Python `glob` 模块的功能与使用 #### 1. 模块概述 `glob` 是 Python 标准库中的一个重要模块,用于文件路径的匹配和查找。它基于 Unix Shell 的通配符语法,允许开发者通过指定模式来筛选符合条件的文件列表[^2]。 #### 2. 基本功能 `glob` 提供了两种主要函数:`glob()` 和 `iglob()`。 - **`glob.glob(pattern)`**: 返回一个包含所有匹配文件路径的列表。如果未找到任何匹配项,则返回空列表。 - **`glob.iglob(pattern)`**: 返回一个生成器对象,每次调用时逐步返回下一个匹配的文件路径。这种方式更节省内存,在处理大量文件时尤为有用[^4]。 #### 3. 使用方法 以下是具体的使用方式及其说明: ##### (1) 文件名匹配 可以通过简单的通配符模式(如 `*`, `?`, `[seq]`, `[!seq]`)进行文件名匹配。例如: ```python import glob # 查找当前目录下所有 .txt 文件 files = glob.glob("*.txt") print(files) ``` 上述代码会打印出当前工作目录下的所有 `.txt` 文件名称[^1]。 ##### (2) 跨目录查找 可以结合相对路径或绝对路径进行跨目录的文件查找。例如: ```python # 查找父目录中所有的 .py 文件 parent_py_files = glob.glob("../ *.py") print(parent_py_files) ``` 此代码片段展示了如何访问上层目录中的 Python 文件。 ##### (3) 利用生成器逐一处理大数量级文件 当面对海量数据集时,推荐使用 `iglob` 函数以减少内存占用。如下所示: ```python for file_path in glob.iglob("**/*.log", recursive=True): # 支持递归搜索子目录 print(file_path) ``` 这里的关键参数 `recursive=True` 启用了对子目录的递归扫描能力。 #### 4. 实际应用场景举例 假设有一个需求——统计某个项目根目录及其所有子目录内的所有 Python 源码文件总数,那么可以用下面这段脚本来完成任务: ```python count = 0 for _ in glob.iglob('project_root/**/*.py', recursive=True): count += 1 print(f'Total number of python files: {count}') ``` 以上实例充分体现了 `glob` 在复杂场景下的灵活性与强大之处[^3]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值