1 文件与文件系统
打开文件
open(file, mode='r', buffering=None, encoding=None, errors=None, newline=None, closefd=True)
Open file and return a stream. Raise OSError upon failure.- file: 必需,文件路径(相对或者绝对路径)。
- mode: 可选,文件打开模式
- buffering: 设置缓冲
- encoding: 一般使用utf8
- errors: 报错级别
- newline: 区分换行符
f=open('将进酒.txt',encoding='utf8')
print(f)
<_io.TextIOWrapper name='将进酒.txt' mode='r' encoding='utf8'>
for i in f:
print(i)
君不见,黄河之水天上来,奔流到海不复回。
君不见,高堂明镜悲白发,朝如青丝暮成雪。
人生得意须尽欢,莫使金樽空对月。
天生我材必有用,千金散尽还复来。
烹羊宰牛且为乐,会须一饮三百杯。
岑夫子,丹丘生,将进酒,杯莫停。
与君歌一曲,请君为我倾耳听。
钟鼓馔玉不足贵,但愿长醉不复醒。
古来圣贤皆寂寞,惟有饮者留其名。
陈王昔时宴平乐,斗酒十千恣欢谑。
主人何为言少钱,径须沽取对君酌。
五花马,千金裘,呼儿将出换美酒,与尔同销万古愁。
文件对象方法
fileObject.close()
用于关闭一个已打开的文件。关闭后的文件不能再进行读写操作, 否则会触发ValueError错误。
f=open('将进酒.txt')
print('文件名:',f.name)
f.close()
for i in f:
print(i)
文件名: 将进酒.txt
---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
<ipython-input-12-4c79a7b9c99a> in <module>
2 print('文件名:',f.name)
3 f.close()
----> 4 for i in f:
5 print(i)
ValueError: I/O operation on closed file.
fileObject.read([size])
用于从文件读取指定的字符数,如果未给定或为负则读取所有。
f=open('将进酒.txt',encoding='utf8')
print(f)
w=f.read(10)
print(w)
f.close()
<_io.TextIOWrapper name='将进酒.txt' mode='r' encoding='utf8'>
君不见,黄河之水天
fileObject.readline()
读取整行,包括 “\n” 字符。
f=open('将进酒.txt',encoding='utf8')
w=f.readline()
print(w)
print('2:',f.readline())
print('3:',f.readline())
print('4:',f.readline())
print('5:',f.readline())
君不见,黄河之水天上来,奔流到海不复回。
2: 君不见,高堂明镜悲白发,朝如青丝暮成雪。
3: 人生得意须尽欢,莫使金樽空对月。
4: 天生我材必有用,千金散尽还复来。
5: 烹羊宰牛且为乐,会须一饮三百杯。
fileObject.readlines()
用于读取所有行(直到结束符 EOF)并返回列表,该列表可以由 Python 的 for… in … 结构进行处理。
f=open('将进酒.txt',encoding='utf8')
line=f.readlines()
print(line)
[' 君不见,黄河之水天上来,奔流到海不复回。\n', ' 君不见,高堂明镜悲白发,朝如青丝暮成雪。\n', ' 人生得意须尽欢,莫使金樽空对月。\n', ' 天生我材必有用,千金散尽还复来。\n', ' 烹羊宰牛且为乐,会须一饮三百杯。\n', ' 岑夫子,丹丘生,将进酒,杯莫停。\n', ' 与君歌一曲,请君为我倾耳听。\n', ' 钟鼓馔玉不足贵,但愿长醉不复醒。\n', ' 古来圣贤皆寂寞,惟有饮者留其名。\n', ' 陈王昔时宴平乐,斗酒十千恣欢谑。\n', ' 主人何为言少钱,径须沽取对君酌。\n', ' 五花马,千金裘,呼儿将出换美酒,与尔同销万古愁。']
f=open('将进酒.txt',encoding='utf8')
line=f.readlines()
for i in line:
print(i)
f.close()
君不见,黄河之水天上来,奔流到海不复回。
君不见,高堂明镜悲白发,朝如青丝暮成雪。
人生得意须尽欢,莫使金樽空对月。
天生我材必有用,千金散尽还复来。
烹羊宰牛且为乐,会须一饮三百杯。
岑夫子,丹丘生,将进酒,杯莫停。
与君歌一曲,请君为我倾耳听。
钟鼓馔玉不足贵,但愿长醉不复醒。
古来圣贤皆寂寞,惟有饮者留其名。
陈王昔时宴平乐,斗酒十千恣欢谑。
主人何为言少钱,径须沽取对君酌。
五花马,千金裘,呼儿将出换美酒,与尔同销万古愁。
fileObject.tell()
返回文件的当前位置,即文件指针当前位置。
f=open('将进酒.txt',encoding='utf8')
line=f.read(25)
print(line)
tell=f.tell()
print(tell)
f.close()
君不见,黄河之水天上来,奔流到海不复回。
君不
70
fileObject.seek(offset[, whence])
用于移动文件读取指针到指定位置。
offset
:开始的偏移量,也就是代表需要移动偏移的字节数,如果是负数表示从倒数第几位开始。
whence
:可选,默认值为 0。给offset
定义一个参数,表示要从哪个位置开始偏移;0 代表从文件开头开始算起,1 代表从当前位置开始算起,2 代表从文件末尾算起。
f=open('将进酒.txt',encoding='utf8')
line=f.readline()
print(line)
line2=f.readline()
print(line2)
f.seek(0,0)
line3=f.readline()
print(line3)
f.close()
君不见,黄河之水天上来,奔流到海不复回。
君不见,高堂明镜悲白发,朝如青丝暮成雪。
君不见,黄河之水天上来,奔流到海不复回。
fileObject.write(str)
用于向文件中写入指定字符串,返回的是写入的字符长度。
f=open('workfile.txt','wb+')
print(f.write(b'012345tfertyu'))
print(f.seek(5))
print(f.read(1))
print(f.seek(-3,2))
print(f.read(1))
13
5
b'5'
10
b't'
在文件关闭前或缓冲区刷新前,字符串内容存储在缓冲区中,这时你在文件中是看不到写入的内容的。
如果文件打开模式带b,那写入文件内容时,str(参数)要用encode方法转为bytes形式,否则报错:TypeError: a bytes-like object is required, not ‘str’。
f=open('将进酒.txt',mode='r+')
str='\n作者:李白'
f.seek(0,2)
line=f.write(str)
f.seek(0,0)
for i in f:
print(i)
f.close()
君不见,黄河之水天上来,奔流到海不复回。
君不见,高堂明镜悲白发,朝如青丝暮成雪。
人生得意须尽欢,莫使金樽空对月。
天生我材必有用,千金散尽还复来。
烹羊宰牛且为乐,会须一饮三百杯。
岑夫子,丹丘生,将进酒,杯莫停。
与君歌一曲,请君为我倾耳听。
钟鼓馔玉不足贵,但愿长醉不复醒。
古来圣贤皆寂寞,惟有饮者留其名。
陈王昔时宴平乐,斗酒十千恣欢谑。
主人何为言少钱,径须沽取对君酌。
五花马,千金裘,呼儿将出换美酒,与尔同销万古愁。
作者:李白
fileObject.writelines(sequence)
向文件写入一个序列字符串列表,如果需要换行则要自己加入每行的换行符\n。
f=open('将进酒.txt',mode='r+')
str1=['\n要求:\n','背诵']
f.seek(0,2)
f.writelines(str1)
f.seek(0, 0)
for i in f:
print(i)
f.close()
君不见,黄河之水水天上来,奔流到海不复回。
君不见,高堂明镜悲白发,朝如青丝暮成雪。
人生得意须尽欢,莫使金樽空对月。
天生我材必有用,千金散尽还复来。
烹羊宰牛且为乐,会须一饮三百杯。
岑夫子,丹丘生,将进酒,杯莫停。
与君歌一曲,请君为我倾耳听。
钟鼓馔玉不足贵,但愿长醉不复醒。
古来圣贤皆寂寞,惟有饮者留其名。
陈王昔时宴平乐,斗酒十千恣欢谑。
主人何为言少钱,径须沽取对君酌。
五花马,千金裘,呼儿将出换美酒,与尔同销万古愁。
作者:李白
要求:
背诵
简洁的with语句
一些对象定义了标准的清理行为,无论系统是否成功的使用了它,一旦不需要它了,那么这个标准的清理行为就会执行。
关键词 with 语句就可以保证诸如文件之类的对象在使用完之后一定会正确的执行它的清理方法。
try:
f=open('将进酒1.txt',mode='w')
for i in f:
print(i)
except OSError as error:
print('出错了,',error)
finally:
f.close()
出错了, not readable
try:
with open('将进酒2.txt',mode='w') as f:
for i in f:
print(i)
except OSError as error:
print('出错了,',error)
出错了, not readable
2 OS模块中关于文件/目录常用的函数
我们所知道常用的操作系统就有:Windows,Mac OS,Linux,Unix等,这些操作系统底层对于文件系统的访问工作原理是不一样的,因此你可能就要针对不同的系统来考虑使用哪些文件系统模块……,这样的做法是非常不友好且麻烦的,因为这样就意味着当你的程序运行环境一改变,你就要相应的去修改大量的代码来应对。
有了OS(Operation System)模块,我们不需要关心什么操作系统下使用什么模块,OS模块会帮你选择正确的模块并调用。
os.getcwd()
用于返回当前工作目录。os.chdir(path)
用于改变当前工作目录到指定的路径。
import os
print('当前工作路径:',os.getcwd())
path='C:\\'
os.chdir(path)
print('当前工作路径:',os.getcwd())
listdir (path='.')
返回path指定的文件夹包含的文件或文件夹的名字的列表。
import os
dirs=os.listdir()
for i in dirs:
print(i)
os.mkdir(path)
创建单层目录,如果该目录已存在抛出异常。os.makedirs(path)
用于递归创建多层目录,如果该目录已存在抛出异常。os.remove(path)
用于删除指定路径的文件。如果指定的路径是一个目录,将抛出 OSError。os.rmdir(path)
用于删除单层目录。仅当这文件夹是空的才可以, 否则, 抛出 OSError。os.removedirs(path)
递归删除目录,从子目录到父目录逐层尝试删除,遇到目录非空则抛出异常。os.rename(src, dst)
方法用于命名文件或目录,从 src 到 dst,如果 dst 是一个存在的目录, 将抛出 OSError。os.system(command)
运行系统的shell命令(将字符串转化成命令)os.curdir
指代当前目录(.)os.pardir
指代上一级目录(…)os.sep
输出操作系统特定的路径分隔符(win下为\,Linux下为/)os.linesep
当前平台使用的行终止符(win下为\r\n,Linux下为\n)os.name
指代当前使用的操作系统(包括:‘mac’,‘nt’)os.path.basename(path)
去掉目录路径,单独返回文件名os.path.dirname(path)
去掉文件名,单独返回目录路径os.path.join(path1[, path2[, ...]])
将 path1,path2 各部分组合成一个路径名os.path.split(path)
分割文件名与路径,返回(f_path,f_name)元组。如果完全使用目录,它会将最后一个目录作为文件名分离,且不会判断文件或者目录是否存在。os.path.splitext(path)
分离文件名与扩展名,返回(f_path,f_name)元组。os.path.getsize(file)
返回指定文件大小,单位是字节。os.path.getatime(file)
返回指定文件最近的访问时间os.path.getctime(file)
返回指定文件的创建时间os.path.getmtime(file)
返回指定文件的最新的修改时间- 浮点型秒数,可用time模块的gmtime()或localtime()函数换算
os.path.exists(path)
判断指定路径(目录或文件)是否存在os.path.isabs(path)
判断指定路径是否为绝对路径os.path.isdir(path)
判断指定路径是否存在且是一个目录os.path.isfile(path)
判断指定路径是否存在且是一个文件os.path.islink(path)
判断指定路径是否存在且是一个符号链接os.path.ismount(path)
判断指定路径是否存在且是一个悬挂点os.path.samefile(path1,path2)
判断path1和path2两个路径是否指向同一个文件
3 序列化与反序列化
Python 的 pickle 模块实现了基本的数据序列和反序列化。
- 通过 pickle 模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,永久存储。
- 通过 pickle 模块的反序列化操作,我们能够从文件中创建上一次程序保存的对象。
pickle模块中最常用的函数为:
pickle.dump(obj, file, [,protocol])
将obj对象序列化存入已经打开的file中。
-
obj
:想要序列化的obj对象。 -
file
:文件名称。 -
protocol
:序列化使用的协议。如果该项省略,则默认为0。如果为负值或HIGHEST_PROTOCOL,则使用最高的协议版本。
pickle.load(file)
将file中的对象序列化读出。 -
file
:文件名称。
import pickle
dataList = [[1, 1, 'yes'],
[1, 1, 'yes'],
[1, 0, 'no'],
[0, 1, 'no'],
[0, 1, 'no']]
dataDic = {0: [1, 2, 3, 4],
1: ('a', 'b'),
2: {'c': 'yes', 'd': 'no'}}
# 使用dump()将数据序列化到文件中
fw = open(r'.\dataFile.pkl', 'wb')
# Pickle the list using the highest protocol available.
pickle.dump(dataList, fw, -1)
# Pickle dictionary using protocol 0.
pickle.dump(dataDic, fw)
fw.close()
# 使用load()将数据从文件中序列化读出
fr = open('dataFile.pkl', 'rb')
data1 = pickle.load(fr)
print(data1)
data2 = pickle.load(fr)
print(data2)
fr.close()
[[1, 1, 'yes'], [1, 1, 'yes'], [1, 0, 'no'], [0, 1, 'no'], [0, 1, 'no']]
{0: [1, 2, 3, 4], 1: ('a', 'b'), 2: {'c': 'yes', 'd': 'no'}}
练习题:
1、打开中文字符的文档时,会出现乱码,Python自带的打开文件是否可以指定文字编码?还是只能用相关函数?
encoding='utf8'
2、编写程序查找最长的单词
输入文档: res/test.txt
题目说明:
"""
Input file
test.txt
Output file
['general-purpose,', 'object-oriented,']
"""
def longest_word(filename):
# your code here
pass