1,文件操作的函数
f= open(文件名(路径),mode="模式(r\w\a\r+\b)",encoding="字符集(GBK\UTF-8)")
content = f.read() \ write()
print(content)
f.close()
文件路径:
1,绝对路径:从磁盘的根目录找 或者 从互联网上
2,相对路径:相当于当前程序所在的文件夹 ../上一层文件夹
我们更推荐大家使用相对路径. 因为在我们把程序拷贝给别人使用的时候. 直接把项目拷贝走 就能运行. 但是如果用绝对路径. 那还需要拷贝外部的文件.
2,模式 (r, w, a, r+, b 常用)
r 只读
1.read() 将文件中的内容全部读取出来. 弊端: 占内存. 如果文件过大.容易导致内存崩溃
2.read(n) 读取n个字符. 需要注意的是. 如果再次读取. 那么会在当前位置继续去读而不是从头读, 如果使用的是rb模式. 则读取出来的是n个字节
3.readline() 一次读取⼀行数据, 注意: readline()结尾, 注意每次读取出来的数据都会有一 个\n 所以呢. 需要我们使用strip()方法来去掉\n或者空格
4.readlines()将每⼀行形成⼀个元素, 放到⼀个列表中. 将所有的内容都读取出来. 所以也是容易出现内存崩溃的问题.不推荐
5. 循环读取. 这种⽅式是组好的. 每次读取一⾏内容.不会产生内存溢出的问题
注意: 读取完的⽂件句柄⼀定要关闭 f.close()
w 模式:只写
带w的,只要你操作了,第一次操作就会清空原文件数据全部清空增加写的内容,后面写不会清空
如果文件不存在就创建文件
a 模式:追加
写的时候,换行需要手动控制
b:处理非文本文件——wb rb ab(bytes类型)如果处理的是非文本文件,mode里如果有b,encoding就不能给了
+:
r+:读写
最好用的读写同时存在的模式
r+的一个坑:不论你读取了多少内容,无论光标在哪,写入的时候都是在结尾写入
w+:写读
清空内容,写入
a+:写读追加写读
3, 常用的操作
1,光标(seek) 移动的单位是byte. 所以如果是UTF-8的中文部分要 是3的倍数
f.seek(0)——将光标移动到开头
f.seek(0,2)——将光标移动到末尾 seek的第二个参数表⽰的是从哪个位置进⾏偏移, 默认是0, 表示开头, 1表示当前位置, 2表示结尾
2,tell()——拿到光标的位置
3,truncate()——截断内容
从文件开头截断到光标位置
如果给参数,从头截断到参数位置
深坑请注意: 在r+模式下. 如果读取了内容. 不论读取内容多少. 光标显⽰的是多少. 再写入 或者操作⽂件的时候都是在结尾进⾏的操作. 所以如果想做截断操作. 记住了. 要先挪动光标. 挪动到你想要截断的位置. 然后再进⾏截断 关于truncate(n), 如果给出了n. 则从开头进行截断, 如果不给n, 则从当前位置截断. 后面 的内容将会被删除
4,修改文件
1,引入os模块 import os
2,打开目标文件,r
3,打开副本文件,w
4,从r中读取内容进行修改,写入副本中
5,删除源文件
6,重命名副本
day08——作业
1,有如下文件,a1.txt,里面的内容为:
老男孩是最好的培训机构,
全心全意为学生服务,
只为学生未来,不为牟利。
我说的都是真的。哈哈
分别完成以下的功能:
a,将原文件全部读出来并打印。
f = open("a1.txt",mode="r",encoding="utf-8")
s = f.read()
print(s)
f.flush()
f.close()
b,在原文件后面追加一行内容:信不信由你,反正我信了。
f = open('a1.txt',mode="a",encoding="utf-8")
f.write("\n信不信由你,反正我信了")
f.flush()
f.close()
c,将原文件全部读出来,并在后面添加一行内容:信不信由你,反正我信了。
f = open("a1.txt",mode="r+",encoding="utf-8")
s = f.read()
print(s)
f.write("\n信不信由你,反正我信了")
f.flush()
f.close()
d,将原文件全部清空,换成下面的内容:
每天坚持一点,
每天努力一点,
每天多思考一点,
慢慢你会发现,
你的进步越来越大。
f = open("a1.txt",mode="w",encoding="utf-8")
f.write("每天坚持一点,\n每天努力一点,\n每天多思考一点,\n慢慢你会发现,\n你的进步越来越大")
f.flush()
f.close()
e,将原文件内容全部读取出来,并在‘我说的都是真的。哈哈’这一行的前面加一行,
‘你们就信吧~’然后将更改之后的新内容,写入到一个新文件:a1.txt。
import os
with open("a1.txt",mode="r+",encoding="utf-8")as f,\
open("a1_1.txt",mode="w",encoding="utf-8")as f1:
for line in f:
f1.write(line.replace("我说的都是真的。哈哈","你们就信吧~\n我说的都是真的。哈哈"))
os.remove("a1.txt")
os.rename("a1_1.txt","a1.txt")
2,有如下文件,t1.txt,里面的内容为:
葫芦娃,葫芦娃,
一根藤上七个瓜
风吹雨打,都不怕,
啦啦啦啦。
我可以算命,而且算的特别准:
上面的内容你肯定是心里默唱出来的,对不对?哈哈
分别完成下面的功能:
a,以r+的模式打开原文件,判断原文件是否可读,是否可写。
f = open("t1.txt",mode="r+",encoding="utf-8")
print(f.readable())
print(f.writable())
f.close()
b,以r的模式打开原文件,利用for循环遍历文件句柄。
f = open("t1.txt",mode='r',encoding="utf-8")
for line in f:
print(line,end="")
c,以r的模式打开原文件,以readlines()方法读取出来,并循环遍历,readlines(),并分析b,与c 有什么区别?
f = open("t1.txt",mode='r',encoding="utf-8")
lst = f.readlines()
for i in lst:
print(i,end="")
深入理解文件句柄与readlines()结果的区别。
d,以r模式读取‘葫芦娃,’前四个字符。
f = open("t1.txt",mode='r',encoding="utf-8")
s = f.read(4)
print(s)
f.flush()
f.close()
e,以r模式读取第一行内容,并去除此行前后的空格,制表符,换行符。
f = open("t1.txt",mode='r',encoding="utf-8")
s = f.readline()
print(s.strip())
f,以r模式打开文件,从‘风吹雨打.....’开始读取,一直读到最后。
f = open("t1.txt",mode='r',encoding="utf-8")
for i in f:
if i.startswith("风吹雨打"):
print(i,end='')
print(f.read(()))
f.flush()
f.close()
g,以a+模式打开文件,先追加一行:‘老男孩教育’然后在从最开始将 原内容全部读取出来。
f = open("t1.txt",mode='a+',encoding="utf-8")
f.write("\n老男孩教育")
f.seek(0)
s = f.read()
print(s)
f.flush()
f.close()
h,截取原文件,截取内容:‘葫芦娃,葫芦娃,’
f = open("t1.txt",mode='r+',encoding="utf-8")
f.seek(24)
f.truncate()
f.seek(0)
s = f.read()
print(s)
f.close()
3,文件a.txt内容:每一行内容分别为商品名字,价钱,个数。
apple 10 3
tesla 100000 1
mac 3000 2
lenovo 30000 3
chicken 10 3
通过代码,将其构建成这种数据类型:[{'name':'apple','price':10,'amount':3},
{'name':'tesla','price':1000000,'amount':1}......] 并计算出总价钱。
l=[]
m=0
sum=0
with open('a3.txt',mode='r',encoding='utf-8') as a:
for i in a:
dic={}
b=i.split()
dic['name']=b[0]
dic['price']=b[1]
dic['amount']=b[2]
l.append(dic)
n=int(l[m]['price'])*int(l[m]['amount'])
sum=sum+n
m=m+1print(l)
print(sum)
4,有如下文件:
alex是老男孩python发起人,创建人。
alex其实是人妖。
谁说alex是sb?
你们真逗,alex再牛逼,也掩饰不住资深屌丝的气质。
将文件中所有的alex都替换成大写的SB(文件的改的操作)。
import os
with open("alex.txt",mode="r",encoding="utf-8")as f,\
open("alex_1.txt",mode="w",encoding="utf-8")as f1:
for line in f:
s = line.replace("alex","SB")
f1.write(s)
os.remove("alex.txt")
os.rename("alex_1.txt","alex.txt")
5,文件a1.txt内容(升级题)
name:apple price:10 amount:3 year:2012
name:tesla price:100000 amount:1 year:2013
.......
通过代码,将其构建成这种数据类型:
[{'name':'apple','price':10,'amount':3},
{'name':'tesla','price':1000000,'amount':1}......]
并计算出总价钱。
sum = 0
li = []
with open("a1.txt", mode="r", encoding="utf-8") as f:
for i in f.readlines():
dic = {}
c = i.split("\n")[0].split(" ")
for j in c:
dic[j.split(':')[0]] = j.split(':')[1]
sum = sum + int(dic["price"]) * int(dic["amount"])
li.append(dic)
print(li)
print(sum)
6,文件a1.txt内容(升级题)
序号 部门 人数 平均年龄 备注
1 python 30 26 单身狗
2 Linux 26 30 没对象
3 运营部 20 24 女生多
.......
通过代码,将其构建成这种数据类型:
[{'序号':'1','部门':Python,'人数':30,'平均年龄':26,'备注':'单身狗'},
......]
lis = []
with open('a3.txt',mode="r",encoding='utf-8') as f:
s = f.readline().split()
for i in f.readlines():
dic = {}
c = i.split()
for j in range(len(c)):
dic[s[j]] = c[j]
lis.append(dic)
print(lis)