在python的文件操作中,Open是第一步。Open的第二个参数是一个字符串,想必大家都清楚,表示打开方式,主要就是读或者写:
w:以写方式打开,
a:以追加模式打开 (从 EOF 开始, 必要时创建新文件)
r+:以读写模式打开
w+:以读写模式打开 (参见 w )
a+:以读写模式打开 (参见 a )
rb:以二进制读模式打开
wb:以二进制写模式打开 (参见 w )
ab:以二进制追加模式打开 (参见 a )
rb+:以二进制读写模式打开 (参见 r+ )
wb+:以二进制读写模式打开 (参见 w+ )
ab+:以二进制读写模式打开 (参见 a+ )
以上是常用的参考资料。
乍一看,w+和r+似乎是一样的,都是以读写模式打开。一般的时候,图省事,很多时候我们都随便用一个带‘’+‘’的打开。但是,在实际应用过程中,w+和r+其实大有不同。
以我写的一个数据清洗的小程序为例:
程序的功能是把从百度文库或者知网阅读器里复制出来的文字进行初步清洗,删除用各种编码打出来的多余空格和换行符,并全部替换为一个‘’
#clean.py
import re,os
def clean(x):
i=os.path.splitext(x)#抠文件路径
x=open(x,'r+',encoding='utf-16')
x=s