1. 文件的基本操作
1.1 操作文件的函数/方法
在python中要操作文件需要记住1个函数,3个方法方法:
open 打开文件,并且返回文件操作对象
read 将文件内容读到内存中
write 将指定文件内容写入文件
close 关闭文件
read、write、close 三个方法都是需要通过 文件对象来调用的
1.2 read 方法 ----读取文件
open 函数的第一个参数是要打开的文件名(文件名区分大小写的)
如果文件存在,返回 文件操作对象
如果文件不存在,会抛出异常。
read 方法可以一次性 读入并 返回文件的所有内容
close 方法负责 关闭文件
如果 忘记关闭文件, 会造成系统资源消耗,而且会影响到后续对文件的访问
所以对文件操作完后,一定记得关闭文件
注意: read 方法执行后,会把 文件指针 移动到文件 末尾
1.3 文件指针
文件指针 标记 从那个位置开始读取 文件数据
第一次打开文件时,通常 文件指针会指向 文件的开始位置
当 执行了 read 方法后,文件指针 会移动到 读取文件内容的末尾
默认情况下会 移动到文件末尾
1.4 文件的打卡方式
open 函数 默认以只读 方式打开文件,并且返回文件对象
语法:
open("文件名","当问方式")
访问方式 说明
r 以只读方式打开文件,文件指针指向文件开头,这种方式是默认的,如果文件不存在则抛出异常
w 以只写方式打开文件,如果文件存在会被覆盖,如果文件不存在,则创建文件
a 以追加方式打开文件,如果文件已存在,文件指针将会放在文件的结尾,如果文件不存在,则创建文件进行写入
r+ 以读写方式打开文件,文件指针指向文件开头,如果文件不存在,则创建文件
w+ 以读写方式打开文件,如果文件存在会被覆盖,如果文件不存在,则创建文件
a+ 以读写方式打开文件,如果文件已存在,文件指针将会放在文件的结尾,如果文件不存在,则创建文件进行写入
1.5 按行读取文件
read 方法默认会把文件的所有内容 一次 性读取到内存
如果文件太大,对内存的占用会非常严重
readline方法:
readline 方法可以一次 读取一行内容
方法执行后,会把文件指针 移动到下一行,准备再读取
2. 文件/目录的常用管理操作
在终端/文件浏览器 中可以执行常规的 文件/目录 管理操作,例如:
创建,重命名,删除,改变路径,查看目录内容。
在python 中, 如果希望通过程序实现上述功能,需要导入 os 模块。
文件操作
rename 重命名文件 os.rename(源文件名, 目录文件名)
remove 删除文件 os.remove(文件名)
目录操作
listdir 目录列表 os.listdir(目录名)
mkdir 创建目录 os.mkdir(目录名)
rmdir 删除目录 os.rmdir(目录名)
getcwd 获取当前目录 os.getcwd()
chdir 修改工作目录 os.chdir(目标目录)
3. 文本文件的编码格式
文本文件存储内容是基于字符编码的文件,常见的编码有 ASCII编码,UNICODE编码等
python2.x 默认使用 ASCII编码
python3.x 默认使用 UNICODE编码
3.1 ASCII编码 和 UNICODE编码
ASCII编码
计算机中只有 256 个 ASCII 字符
一个 ASCII 在内存中占1个字节的空间
UNICODE编码
常见的UTF-8 编码格式,在计算机中使用1-6 个字符来表示一个UTF-8 字符,涵盖了地球上几乎所有地区的文字
大多数汉字会使用 3 个字符表示
3.2在 python2.x 中如何使用中文
在python2.x 文件的第一行增加以下代码,解释器会以UTF-8 编码来处理python 文件
# *-*coding:utf8 *-*
这种方式是官方推荐使用的,也可以用:
#codung=utf8
unicode 字符
在python2.x 中,即使指定了文件使用UTF-8的编码格式,但是在遍历字符串时,仍然会以 字节为单位遍历 字符串
要能够 正确的遍历字符串,在定义字符串时,要在字符串的引号前,增加一个
小写字母u,告诉解释器这是一个unicode 字符串(使用UTF-8编码格式的字符)
1.1 操作文件的函数/方法
在python中要操作文件需要记住1个函数,3个方法方法:
open 打开文件,并且返回文件操作对象
read 将文件内容读到内存中
write 将指定文件内容写入文件
close 关闭文件
read、write、close 三个方法都是需要通过 文件对象来调用的
1.2 read 方法 ----读取文件
open 函数的第一个参数是要打开的文件名(文件名区分大小写的)
如果文件存在,返回 文件操作对象
如果文件不存在,会抛出异常。
read 方法可以一次性 读入并 返回文件的所有内容
close 方法负责 关闭文件
如果 忘记关闭文件, 会造成系统资源消耗,而且会影响到后续对文件的访问
所以对文件操作完后,一定记得关闭文件
注意: read 方法执行后,会把 文件指针 移动到文件 末尾
1.3 文件指针
文件指针 标记 从那个位置开始读取 文件数据
第一次打开文件时,通常 文件指针会指向 文件的开始位置
当 执行了 read 方法后,文件指针 会移动到 读取文件内容的末尾
默认情况下会 移动到文件末尾
1.4 文件的打卡方式
open 函数 默认以只读 方式打开文件,并且返回文件对象
语法:
open("文件名","当问方式")
访问方式 说明
r 以只读方式打开文件,文件指针指向文件开头,这种方式是默认的,如果文件不存在则抛出异常
w 以只写方式打开文件,如果文件存在会被覆盖,如果文件不存在,则创建文件
a 以追加方式打开文件,如果文件已存在,文件指针将会放在文件的结尾,如果文件不存在,则创建文件进行写入
r+ 以读写方式打开文件,文件指针指向文件开头,如果文件不存在,则创建文件
w+ 以读写方式打开文件,如果文件存在会被覆盖,如果文件不存在,则创建文件
a+ 以读写方式打开文件,如果文件已存在,文件指针将会放在文件的结尾,如果文件不存在,则创建文件进行写入
1.5 按行读取文件
read 方法默认会把文件的所有内容 一次 性读取到内存
如果文件太大,对内存的占用会非常严重
readline方法:
readline 方法可以一次 读取一行内容
方法执行后,会把文件指针 移动到下一行,准备再读取
2. 文件/目录的常用管理操作
在终端/文件浏览器 中可以执行常规的 文件/目录 管理操作,例如:
创建,重命名,删除,改变路径,查看目录内容。
在python 中, 如果希望通过程序实现上述功能,需要导入 os 模块。
文件操作
rename 重命名文件 os.rename(源文件名, 目录文件名)
remove 删除文件 os.remove(文件名)
目录操作
listdir 目录列表 os.listdir(目录名)
mkdir 创建目录 os.mkdir(目录名)
rmdir 删除目录 os.rmdir(目录名)
getcwd 获取当前目录 os.getcwd()
chdir 修改工作目录 os.chdir(目标目录)
3. 文本文件的编码格式
文本文件存储内容是基于字符编码的文件,常见的编码有 ASCII编码,UNICODE编码等
python2.x 默认使用 ASCII编码
python3.x 默认使用 UNICODE编码
3.1 ASCII编码 和 UNICODE编码
ASCII编码
计算机中只有 256 个 ASCII 字符
一个 ASCII 在内存中占1个字节的空间
UNICODE编码
常见的UTF-8 编码格式,在计算机中使用1-6 个字符来表示一个UTF-8 字符,涵盖了地球上几乎所有地区的文字
大多数汉字会使用 3 个字符表示
3.2在 python2.x 中如何使用中文
在python2.x 文件的第一行增加以下代码,解释器会以UTF-8 编码来处理python 文件
# *-*coding:utf8 *-*
这种方式是官方推荐使用的,也可以用:
#codung=utf8
unicode 字符
在python2.x 中,即使指定了文件使用UTF-8的编码格式,但是在遍历字符串时,仍然会以 字节为单位遍历 字符串
要能够 正确的遍历字符串,在定义字符串时,要在字符串的引号前,增加一个
小写字母u,告诉解释器这是一个unicode 字符串(使用UTF-8编码格式的字符)
源代码:https://download.youkuaiyun.com/download/b903299114/10470026