Python遍历文件夹的两种方法比较

最新推荐文章于 2024-06-11 09:33:55 发布

CV_adventurer

最新推荐文章于 2024-06-11 09:33:55 发布

阅读量2.6k

点赞数

分类专栏： python io

python io 专栏收录该内容

3 篇文章

订阅专栏

本文对比了使用os.walk和os.listdir两种方法遍历文件夹的区别，并提供了代码示例。os.walk能递归地列出所有子目录及文件，而os.listdir则按字母顺序输出目录树。此外，还提供了一个将指定目录下的所有.ppm文件转换为.jpg文件的实用脚本。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Python遍历文件夹的两种方法比较

转自：点击打开链接

遍历文件夹是一个很常用的功能吧。这里分别用两种方法实现：

第一种：使用os.walk:

# -*- coding: utf-8 -*- 
import os 
def Test1(rootDir): 
    list_dirs = os.walk(rootDir) 
    for root, dirs, files in list_dirs: 
        for d in dirs: 
            print os.path.join(root, d)      
        for f in files: 
            print os.path.join(root, f)

第二种：使用os.listdir:

# -*- coding: utf-8 -*- 
import os 
def Test2(rootDir): 
    for lists in os.listdir(rootDir): 
        path = os.path.join(rootDir, lists) 
        print path 
        if os.path.isdir(path): 
            Test2(path)

这两种到底有什么区别呢？

这里先建立一个测试目录E:\test，目录结构如下：

E:\TEST 
│--A 
│  │--A-A 
│  │  │--A-A-A.txt 
│  │--A-B.txt 
│  │--A-C 
│  │  │--A-B-A.txt 
│  │--A-D.txt 
│--B.txt 
│--C 
│  │--C-A.txt 
│  │--C-B.txt 
│--D.txt 
│--E

下面通过运行如下代码：

Test1('E:\TEST') 
print '=======================================' 
Test2('E:\TEST')

输出结果为：

>>>  
E:\TEST\A 
E:\TEST\C 
E:\TEST\E 
E:\TEST\B.txt 
E:\TEST\D.txt 
E:\TEST\A\A-A 
E:\TEST\A\A-C 
E:\TEST\A\A-B.txt 
E:\TEST\A\A-D.txt 
E:\TEST\A\A-A\A-A-A.txt 
E:\TEST\A\A-C\A-B-A.txt 
E:\TEST\C\C-A.txt 
E:\TEST\C\C-B.txt 
======================================= 
E:\TEST\A 
E:\TEST\A\A-A 
E:\TEST\A\A-A\A-A-A.txt 
E:\TEST\A\A-B.txt 
E:\TEST\A\A-C 
E:\TEST\A\A-C\A-B-A.txt 
E:\TEST\A\A-D.txt 
E:\TEST\B.txt 
E:\TEST\C 
E:\TEST\C\C-A.txt 
E:\TEST\C\C-B.txt 
E:\TEST\D.txt 
E:\TEST\E 
>>>

可以看出，对于第一种方法，输出总是先文件夹后文件名的，对于第二种，则是按照目录树结构以及按照首字母排序进行输出的。

补充加入：对某目录下（包括子目录）的所有.ppm文件改为.jpg文件。

from PIL import Image
import os
import os.path

def change_format(rootDir):
	for root, dirs, files in os.walk(rootDir):
		for file in files:
			if os.path.splitext(file)[1] == '.ppm':
				im = Image.open(os.path.join(root, file))
				filename = os.path.join(root, file)
				im.save(os.path.splitext(filename)[0] + '.jpg', 'JPEG')

if __name__ == '__main__':
	_dir = "your directory"
	change_format(_dir)

root 为 path（一直到file名字（除去文件名字）），file只是文件名字加上扩展名
此处os.path.join(root,file)为absolute path，os.path.splitext(file)[1]为扩展名（ os.path.splitext(file)[1][1:]为ppm不带.)， os.path.splitext(file)[0]为文件名