python中的glob、shutil、rmtree、remoevall

本文介绍了一种在Python中批量合并文件的方法,并演示了如何利用glob获取文件列表及使用shutil进行文件操作。此外,还提供了一个递归删除目录树的实用脚本,包括错误处理机制。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近在处理数据的时候需要把所有的文件copy成一个,需要实现类似dos下面的copy *.* a.dat,copy结束后,将a.dat 移动到另一个文件夹,同时清空文件。中间试了下shutil,结果发现在rmtree时候经常出错,总有一个文件删除不了。查了半天不清楚原因所在,后来刚好找到了个写好了错误处理的代码,直接使用了。这里glob很好用,可以获取一个当前目录下的文件列表,而且可以给定文件通配符。

    ff=glob.glob("*.ABJ")
    fout = file('fn.dat', 'wb')
    for n in ff:
        fin = file(n, 'rb')
        shutil.copyfileobj(fin, fout, 65536)
        fin.close()
    fout.close()
    fn=datadir+"fn.dat"
    shutil.move(fn,exedir)
    #raw_input("Press ENTER to exit")
    os.chdir("..")
    print os.getcwd()
    #shutil.rmtree(datadir)
    removeall.removeall(datadir)
    print "ok"  

 其中for循环中指定 了65536为防止文件太大。

shutil.rmtree本身没有进行错误处理,本来准备自己写,刚好发现一个别人写好的代码,直接拿来用了。

#! /usr/bin/env python
#coding=utf-8
## {{{ Recipe 193736 (r1): Clean up a directory tree 
""" removeall.py:

   Clean up a directory tree from root.
   The directory need not be empty.
   The starting directory is not deleted.
   Written by: Anand B Pillai <abpillai@lycos.com> """

import sys, os

ERROR_STR= """Error removing %(path)s, %(error)s """

def rmgeneric(path, __func__):

    try:
        __func__(path)
        print 'Removed ', path
    except OSError, (errno, strerror):
        print ERROR_STR % {'path' : path, 'error': strerror }
            
def removeall(path):

    if not os.path.isdir(path):
        return
    
    files=os.listdir(path)

    for x in files:
        fullpath=os.path.join(path, x)
        if os.path.isfile(fullpath):
            f=os.remove
            rmgeneric(fullpath, f)
        elif os.path.isdir(fullpath):
            removeall(fullpath)
            f=os.rmdir
            rmgeneric(fullpath, f)
## End of recipe 193736 }}}
 
### Python `glob` 库的使用方法 #### 基本功能介绍 `glob` 是 Python 中的一个标准库,主要用于通过模式匹配的方式查找指定路径下的文件或目录。它支持常见的通配符语法,例如 `*`, `?`, `[ ]` 等。 以下是几个常用的参数和方法: - **`glob.glob(pathname, *, recursive=False)`**: 返回所有匹配给定模式的文件路径列表[^5]。 - **`glob.iglob(pathname, *, recursive=False)`**: 返回一个生成器对象,每次调用返回下一个匹配项[^2]。 - 参数说明: - `pathname`: 路径模式字符串,可以包含通配符。 - `recursive`: 如果设置为 `True`,则允许递归搜索子目录中的文件[^3]。 --- #### 示例代码展示 ##### 1. 查找当前目录下所有 `.txt` 文件 ```python import glob # 使用 glob 函数获取所有 .txt 文件 text_files = glob.glob("*.txt") print("Text files in current directory:", text_files) ``` 此示例展示了如何利用 `*` 来匹配任意长度的字符序列。 --- ##### 2. 迭代方式处理匹配结果 如果只需要逐一处理匹配到的结果而不是一次性加载整个列表,则可以使用 `iglob()` 方法: ```python import glob for filepath in glob.iglob("*.py"): print(f"Found Python file: {filepath}") ``` 这种方法相较于 `glob()` 更节省内存资源。 --- ##### 3. 递归搜索子目录 为了更深入地探索文件结构并找到嵌套层次较深的目标文件,可以通过启用 `recursive=True` 实现递归查询: ```python import glob # 查找当前目录及其子目录中所有的 .py 文件 python_files = glob.glob("**/*.py", recursive=True) print("Python files including subdirectories:", python_files) ``` 注意这里的双星号 (`**`) 表达的是零个或者多个目录层。 --- ##### 4. 匹配特定字符集 有时可能希望限定某些具体条件比如扩展名前缀含有数字的情况,这时就可以借助方括号定义合法字符区间: ```python import glob # 找出 dir/ 下以任何单个数字结尾的所有类型文件 special_files = glob.glob("dir/*[0-9].*") for sf in special_files: print(sf) ``` 上述片段解释了怎样运用正则表达式的概念去筛选符合条件的数据集合[^4]。 --- ### 总结 综上所述,无论是简单场景还是复杂需求场合,`glob` 都能提供灵活高效的解决方案来完成基于规则驱动的任务自动化流程设计工作。其核心优势在于简洁直观的同时保持强大表现力,非常适合日常开发过程中涉及批量操作的需求分析阶段快速原型构建环节应用实践当中不断优化改进直至最终部署上线运行维护周期内的各个环节均具有重要意义价值所在之处体现得淋漓尽致。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值