os.walk()方法

最新推荐文章于 2024-02-19 16:46:31 发布

转载最新推荐文章于 2024-02-19 16:46:31 发布 · 1.2k 阅读

python基础学习同时被 2 个专栏收录

97 篇文章

订阅专栏

python Module

38 篇文章

订阅专栏

os.sep 获取目录分隔符

=================================================================

os.makedirs() os.removedirs()

os.makedirs()函数用于创建上下级关联的目录、子目录，类似于linux命令 mkdir -p a/b/c。例如os.makedirs("a/b/c")的结果：

与os.makedirs()对应的是os.removedirs()函数，用于删除空的目录。os.removedirs("a/b/c")即可删除空的目录.例如 a/b/c a目录非空,b、c目录均为空，则removedirs可以同时删除b/c目录

如果要删除非空的目录，可以使用shutil模块，shutil.rmtree("a")即可强制删除目录a

===================================================================

#coding:utf-8

import os
def main():
    '''
    root 是起始路径，且是绝对路径
    dirs 起始路径下的目录列表
    files 起始路径下的文件列表
    '''
    for root,dirs,files in os.walk(r'g:'):

        for f in files:
            print '*'*10,root,'*'*10
            print os.path.join(root,f)

if __name__ == '__main__':
    main()

部分结果：

********** g: **********
g:模块5.py
********** g: **********
g:空行输出特殊字符.py
********** g:$RECYCLE.BIN\S-1-5-21-2589521740-3335953511-3928509256-1000 **********
g:$RECYCLE.BIN\S-1-5-21-2589521740-3335953511-3928509256-1000\desktop.ini
********** g:1 **********
g:1\a.a
********** g:1 **********
g:1\aa.aa
********** g:1 **********
g:1\新建文本文档.txt
********** g:1 **********
g:1\齐秦-原来的我.MP3
********** g:auto **********
g:auto\auto.py
********** g:auto **********
g:auto\auto_suit.py
********** g:auto **********
g:auto\dynamic.py

今天第一次进行文件遍历,自己递归写的时候还调试了好久,(主要因为分隔符号的问题),后来发现了os.walk方法,就忍不住和大家分享下.

先看下代码:

import os

for i in os.walk('c:'+os.sep+'ant'):
print i[1]

下面是输出:

c:\ant
c:\ant\bin
c:\ant\docs
c:\ant\docs\ant2
c:\ant\docs\antlibs
c:\ant\docs\antlibs\antunit
c:\ant\docs\antlibs\compress
c:\ant\docs\antlibs\dotnet
c:\ant\docs\antlibs\props
c:\ant\docs\antlibs\svn
c:\ant\docs\images
c:\ant\docs\manual
c:\ant\docs\manual\api
c:\ant\docs\manual\api\org
c:\ant\docs\manual\api\org\apache
c:\ant\docs\manual\api\org\apache\tools
c:\ant\docs\manual\api\org\apache\tools\ant
c:\ant\docs\manual\api\org\apache\tools\ant\dispatch
c:\ant\docs\manual\api\org\apache\tools\ant\filters

后面还有很长.

如果不使用这个方法,遍历同样能达到效果.不过使用 os.walk 方便很多了.这个方法返回的是一个三元tupple(dirpath, dirnames, filenames),

递归遍历给定目录下的内容。（路径、路径下的文件夹、路径下的文件）

其中第一个为起始路径，(起始路径是绝对路径)

第二个为起始路径下的文件夹列表,

第三个是起始路径下的文件列表.

dirpath是一个string，代表目录的路径,

dirnames是一个list，包含了dirpath下所有子目录的名字,

filenames是一个list，包含了非目录文件的名字.这些名字不包含路径信息,如果需要得到全路径,需要使用 os.path.join(dirpath, name).

下面是可以看到 os.walk 方法返回的内容.

代码:

import os

for i in os.walk('c:'+os.sep+'ant'):
print i

输出:

('c:\\ant', ['bin', 'docs', 'etc', 'lib', 'Project'], ['fetch.xml', 'get-m2.xml', 'INSTALL', 'KEYS', 'LICENSE', 'NOTICE', 'README', 'WHATSNEW'])
('c:\\ant\\bin', [], ['ant', 'ant.bat', 'ant.cmd', 'antenv.cmd', 'antRun', 'antRun.bat', 'antRun.pl', 'complete-ant-cmd.pl', 'envset.cmd', 'lcp.bat', 'runant.pl', 'runant.py', 'runrc.cmd'])
('c:\\ant\\docs', ['ant2', 'antlibs', 'images', 'manual', 'projects', 'slides', 'webtest'], ['antnews.html', 'ant_in_anger.html', 'ant_task_guidelines.html', 'appendix_e.pdf', 'breadcrumbs.js', 'bugs.html', 'bylaws.html', 'contributors.html', 'external.html', 'faq.html', 'favicon.ico', 'index.html', 'legal.html', 'LICENSE', 'license.html', 'mail.html', 'mission.html', 'nightlies.html', 'page.css', 'problems.html', 'projects.html', 'resources.html', 'svn.html'])
('c:\\ant\\docs\\ant2', [], ['actionlist.html', 'features.html', 'FunctionalRequirements.html', 'original-specification.html', 'requested-features.html', 'requested-features.txt', 'VFS.txt'])
('c:\\ant\\docs\\antlibs', ['antunit', 'compress', 'dotnet', 'props', 'svn'], ['bindownload.cgi', 'bindownload.html', 'charter.html', 'index.html', 'proper.html', 'sandbox.html', 'srcdownload.cgi', 'srcdownload.html'])
('c:\\ant\\docs\\antlibs\\antunit', [], ['index.html'])
('c:\\ant\\docs\\antlibs\\compress', [], ['index.html'])
('c:\\ant\\docs\\antlibs\\dotnet', [], ['index.html'])
('c:\\ant\\docs\\antlibs\\props', [], ['index.html'])

...

当然后面还有很长了.

有了这个函数无论是遍历文件夹,还是遍历文件都很方便.

下面是我是自己用递归实现的遍历文件方法.

代码:

def listdir(leval,path):
    for i in os.listdir(path):
        print('| '*(leval + 1) + i)
        if os.path.isdir(path+i):
            listdir(leval+1, path+i)

path = 'c:'+os.sep+'ant'

#或者直接 path='C:/ant'
print(path+os.sep)
listdir(0, path+os.sep)

下面是输出: