python遍历文件夹,指定遍历深度与忽略目录

本文介绍了一个Python函数,用于在指定目录及其子目录内查找特定文件,并返回该文件的完整路径。函数支持递归深度限制和忽略指定目录。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

背景

需要在文件夹中搜索某一文件,找到后返回此文件所在目录。用最常规的os.listdir()方式实现了一版,但执行时报错:递归超过最大深度。于是自己添加了点功能,之所有写此函数是为了让它适应不同的项目,因为有项目要找的文件在第一层,有的在第二层。

函数

功能:在文件夹中查找某一文件,找到后返回True与文件所在目录路径。
参数:filepath, 要查找的目录
参数:filename, 要查找的文件
扩展1:find_depth, 查找时指定递归深度;
扩展2:ignore_path, 查找时忽略某些目录;

#!/usr/bin/env python
# coding=utf-8
import os
# from fabric.colors import *

def find_file(self, filepath, filename, find_depth=1, ignore_path=['.git', 'node_modules']):
    """查找文件"""
    # print blue("当前查找目录:{},递归层级:{}".format(filepath, find_depth))
    # 递归深度控制
    find_depth -= 1
    for file_ in os.listdir(filepath):
        # print cyan("file: {}".format(file_))
        if isfile(join(filepath, file_)):
            # print "当前文件:{}".format(file_)
            if file_ == filename:
                return True, filepath
        elif find_depth <= 0:  # 递归深度控制, 为0时退出
            # print yellow("超出递归深度,忽略!")
            continue
        elif file_ in ignore_path:  # 忽略指定目录
            # print yellow("此目录在忽略列表中,跳过!")
            continue
        else:
            result, abs_path = self.find_file(filepath=join(filepath, file_),
                                              filename=filename,
                                              find_depth=find_depth)
            if result:
                print green("找到{}文件,所在路径{}".format(filename, abs_path))
                return result, abs_path
    return False, filepath

result, filepath = find_build(filepath="/data/deploy/jenkins/data/jobs/sit-zjims-mobile/workspace/", filename="gulpfile.js", find_depth=3)
<think>我们使用os.listdir()获取目录下的所有文件文件夹,然后可以通过递归遍历文件夹 这里有两种常见方法:使用递归函数和使用os.walk()。但题目要求用os.listdir(),所以我们用递归实现。 我们将编写一个函数,遍历给定目录及其所有子目录,并打印出文件结构(或执行其他操作) 注意:避免进入符号链接目录导致死循环,这里我们忽略符号链接。</think>### 使用 `os.listdir()` 遍历文件夹的完整指南 #### 基础用法:列出目录内容 ```python import os # 指定遍历目录路径 folder_path = "your/folder/path" # 替换为你的实际路径 # 获取目录下所有文件和子目录的名称列表 contents = os.listdir(folder_path) # 打印所有内容 print("目录内容:") for item in contents: print(item) ``` #### 进阶用法:区分文件文件夹 ```python import os def list_folder_contents(folder_path): """列出文件夹内容并区分文件/文件夹""" items = os.listdir(folder_path) print(f"\n目录: {folder_path}") print("类型 | 名称") print("----------") for item in items: full_path = os.path.join(folder_path, item) if os.path.isfile(full_path): print(f"文件 | {item}") elif os.path.isdir(full_path): print(f"文件夹 | {item}") else: print(f"其他 | {item}") # 使用示例 list_folder_contents("your/folder/path") ``` #### 递归遍历所有子文件夹深度优先) ```python import os def recursive_list_dirs(start_path): """递归遍历所有子文件夹""" for item in os.listdir(start_path): full_path = os.path.join(start_path, item) if os.path.isdir(full_path): print(f"进入文件夹: {full_path}") recursive_list_dirs(full_path) # 递归调用 else: print(f"文件: {full_path}") # 使用示例 recursive_list_dirs("parent/directory") ``` #### 按文件类型过滤 ```python import os def find_files_by_extension(folder_path, extensions): """ 查找特定扩展名的文件 参数: folder_path: 搜索目录 extensions: 扩展名列表 (如 ['.txt', '.jpg']) """ matching_files = [] for item in os.listdir(folder_path): full_path = os.path.join(folder_path, item) # 检查是否是文件且扩展名匹配 if os.path.isfile(full_path): _, ext = os.path.splitext(item) if ext.lower() in extensions: matching_files.append(full_path) return matching_files # 使用示例:查找所有图片文件 image_files = find_files_by_extension("photos", ['.jpg', '.png', '.gif']) print(f"找到 {len(image_files)} 张图片") ``` #### 带路径处理的完整遍历函数 ```python import os def traverse_directory(root_dir): """ 遍历目录并返回结构化的内容信息 返回格式: { "path": 绝对路径, "files": [文件列表], "subdirs": [子目录列表] } """ result = { "path": os.path.abspath(root_dir), "files": [], "subdirs": [] } try: for item in os.listdir(root_dir): full_path = os.path.join(root_dir, item) if os.path.isfile(full_path): result["files"].append(item) elif os.path.isdir(full_path): result["subdirs"].append(item) except PermissionError: print(f"警告: 无权限访问 {root_dir}") return result # 使用示例 directory_info = traverse_directory("your/directory") print(f"目录: {directory_info['path']}") print(f"文件: {directory_info['files']}") print(f"子目录: {directory_info['subdirs']}") ``` ### 重要注意事项 1. **路径处理**: - 始终使用 `os.path.join()` 拼接路径 - 使用 `os.path.abspath()` 获取绝对路径 - 使用 `os.path.normpath()` 规范化路径 2. **错误处理**: ```python try: contents = os.listdir(path) except FileNotFoundError: print(f"目录不存在: {path}") except PermissionError: print(f"无权限访问: {path}") ``` 3. **隐藏文件处理**: ```python # 排除隐藏文件 (以 . 开头) visible_items = [item for item in os.listdir(path) if not item.startswith('.')] ``` 4. **排序选项**: ```python # 按名称排序 sorted_items = sorted(os.listdir(path)) # 按修改时间排序 items_with_mtime = [(item, os.path.getmtime(os.path.join(path, item))) for item in os.listdir(path)] sorted_by_mtime = sorted(items_with_mtime, key=lambda x: x[1], reverse=True) ``` ### 替代方法比较 | 方法 | 优点 | 缺点 | |------|------|------| | `os.listdir()` | 简单直接,返回名称列表 | 需要手动处理路径和类型 | | `os.scandir()` | 性能更好,返回带属性的对象 | Python 3.5+ | | `pathlib.Path()` | 面向对象,更现代 | 需要学习新API | | `os.walk()` | 自动递归遍历 | 无法控制遍历顺序 |
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值