文件与数据格式化
文件概述
文件标识
意义:找到计算机中唯一确定的文件。
组成:文件路径、文件名主干、文件扩展名。
操作系统以文件为单位对数据进行管理。
文件类型:
(1)文本文件:专门存储文本字符数据。
(2)二进制文件:不能直接使用文字处理程序正常读写,必须先了解其结构和序列化规则,再设计正确的反序列化规则,才能正确获取文件信息。
注意:二进制文件和文本文件这两种类型的划分基于数据逻辑存储结构而非物理存储结构,计算机中的数据在物理层面都以二进制形式存储。
标准文件:
Python的sys模块中定义了3个标准文件,分别为:
stdin(标准输入文件)。标准输入文件对应输入设备,如键盘。
stdout(标准输出文件)。
stderr(标准错误文件)。标准输出文件和标准错误文件对应输出设备,如显示器。
标准文件:
import sys
file=sys.stdout
file.write(“hello”)
文件的基础操作
打开文件
file:文件的路径。
mode:设置文件的打开模式,取值有r、w、a。
buffering:设置访问文件的缓冲方式。取值为0或1。
关闭文件
通过close()方法关闭文件,也可以使用with语句实现文件的自动关闭。
file.close()
with open(‘a.txt’) as f:
pass
及时关闭的原因
计算机中可打开的文件数量是有限
打开的文件占用系统资源
若程序因异常关闭,可能产生数据丢失
文件的读写
Python提供了一系列读写文件的方法,包括读取文件的read()、readline()、readlines()方法和写文件的write()、writelines()方法,下面结合这些方法分别介绍如何读写文件。
write()方法可以将指定字符串写入文件,其语法格式如下:
write()
string =“Here we are all,by day;by night.” #字符串
with open(‘write_file.txt’,mode=‘w’,encoding=‘utf-8’)as f:
size=f.write(string) #写入字符串
print(size) #打印字节数
(6)writelines()方法用于将行列表写入文件,其语法格式如下:
writelines(lines)
steing=“Here we are all,by day;\nby night we’re hurl’d By dreams,each one into a several world.”
with open(‘write_file.txt’,mode=‘w’,encoding=‘utf-8’)as f:
f.write(string)
文件与目录管理
os模块中定义了与文件操作相关的函数,利用这些函数可以实现删除文件、文件重命名、创建/删除目录、获取当前目录、更改默认目录与获取目录列表等操作。
管理文件与目录:
删除文件——os.remove(文件名)
文件重命名——os.rename(原文件名,新文件名)
创建/删除目录——os.mkdir(目录名)/os.rmdir(目录名)
获取当前目录——os.getcwd()
更改默认目录——os.chdir(路径名)
获取目录列表——os.listdir(目录/路径)