1.os模块命令
os.curdir 返回('.') 指代当前目录
os.pardir 返回('..') 指代上一级目录
os.chdir(path) 用于改变当前工作目录到指定的路径
os.getcwd() 用于返回当前工作目录
os.listdir(path) 返回指定路径下的文件和文件夹列表
os.path.basename(path),返回path最后的文件名。若path以/或\结尾,那么就会返回空值。
os.path.abspath(path) 返回path规范化的绝对路径。 >>> os.path.abspath('test.csv') 'C:\\Python25\\test.csv'
os.path.dirname(path) 去掉文件名,返回目录(E:/Read_File)
os.path.dirname("E:/Read_File/read_yaml.py")
os.path.exists()是判断某文件是否存在(当前目录)
os.path.splitext() 将文件名和扩展名分开
eg:fname,fename=os.path.splitext('/home/ubuntu/python_coding/split_func/split_function.py')
fname:/home/ubuntu/python_coding/split_func/split_function
fename:.py
os.path.split() 返回文件的路径和文件名
eg:dirname,filename=os.path.split('/home/ubuntu/python_coding/split_func/split_function.py')
dirname:/home/ubuntu/python_coding/split_func
filename:split_function.py
os.sep 不用去考虑 Windows 上,文件的路径分割符号是 '\' ,在 Linux 上 是 ‘/’ ; 根据所处平台,自动地采用相应的分割符号 os.linesep 给出当前平台使用的行终止符。例如,Windows使用'\r\n',Linux使用'\n' 而Mac使用'\r'
os.path.isdir(path) 判断某一路径是否为目录
os.path.isfile(path) 判断某一路径是否为文件
os.walk(top, topdown=True, οnerrοr=None, followlinks=False)
其中: top是要遍历的目录。
topdown是代表要从上而下遍历还是从下往上遍历。
onerror可以用来设置当遍历出现错误的处理函数(该函数接受一个OSError的实例作为参数),设置为空不作处理。
followlinks表示是否要跟随目录下的链接去继续遍历,要注意的是,os.walk不会记录已经遍历的目录,所以跟随链接遍历的话有可能一直循环调用下去。
os.walk返回的是一个3个元素的元组 (root, dirs, files) ,分别表示遍历的路径名,该路径下的目录列表和该路径下文件列表。注意目录列表和文件列表不是具体路径,需要具体路径(从root开始的路径)的话可以用 os.path.join(root,dir) .
2.os.walk()和os.listdir()区别:
os.listdir() 方法用于返回指定的文件夹包含的文件或文件夹的名字的列表。这个列表以字母顺序。 它不包括 '.' 和'..' 即使它在文件夹中。
os.walk() 方法用于通过在目录树中输出在目录中的文件名,向上或者向下。
情况1:在一个目录下面只有文件,没有文件夹,这个时候可以使用os.listdir
在我们的桌面上有一个file目录(文件夹),里面有三个文件
file(dir)
--|test1.txt
--|test2.txt
--|test3.txt
用下面的程序获得文件的绝对路径:
import os
path = r'C:\Users\Administrator\Desktop\file'
for filename in os.listdir(path):
print(os.path.join(path,filename))
使用os.listdir读取到一个目录下面所有的文件名,然后使用os.path.join把目录的路径和文件名结合起来,就得到了文件的绝路路径,结果如下:
C:\Users\Administrator\Desktop\file\test1.txt
C:\Users\Administrator\Desktop\file\test2.txt
C:\Users\Administrator\Desktop\file\test3.txt
情况2:递归的情况,一个目录下面既有目录(目录下面还可能有目录和文件)也有文件,如何读取里面所有文件,使用os.walk:
我们在桌面上面建立一个file目录,里面的组织结构如下:
file(dir):
--|file1(dir):
--|file1_test1.txt
--|file1_test2.txt
--|file2(dir)
--|file2_test1.txt
--|file_test1.txt
--|file_test2.txt
运行一下代码:
import os
path = r'C:\Users\Administrator\Desktop\file'
for dirpath,dirnames,filenames in os.walk(path):
print(dirpath,dirnames,filenames)
输出结果如下:
C:\Users\Administrator\Desktop\file ['file1', 'file2'] ['file_test1.txt', 'file_test2 .txt']
C:\Users\Administrator\Desktop\file\file1 [] ['file1_test1.txt', 'file1_test2.txt']
C:\Users\Administrator\Desktop\file\file2 [] ['file2_test1.txt']
os.walk输入一个路径名称,以yield的方式(其实是一个生成器)返回一个三元组 dirpath, dirnames, filenames, dirpath为目录的路径,为一个字符串。比如上面的 C:\Users\Administrator\Desktop\file和C:\Users\Administrator\Desktop\file\file1等。
dirnames列出了目录路径下面所有存在的目录的名称。比如在 C:\Users\Administrator\Desktop\file下面有两个目录:file1和file2,那么它就列出了这个目录路径下的目录名称。
filenames列出了目录路径下面所有文件的名称。同样在 C:\Users\Administrator\Desktop\file下面有两个文件file_test1.txt和file_test2 .txt,那么程序将会列出这两个文件名。
如何获得一个路径下面所有的文件路径:
import os
path = r'C:\Users\Administrator\Desktop\file'
for dirpath,dirnames,filenames in os.walk(path):
for filename in filenames:
print(os.path.join(dirpath,filename))
得到的结果如下:
C:\Users\Administrator\Desktop\file\file_test1.txt
C:\Users\Administrator\Desktop\file\file_test2 .txt
C:\Users\Administrator\Desktop\file\file1\file1_test1.txt
C:\Users\Administrator\Desktop\file\file1\file1_test2.txt
C:\Users\Administrator\Desktop\file\file2\file2_test1.txt