文件处理的基本流程
1.打开文件
2.修改(如:增加、删除、更新等某些内容等基本操作)
3.关闭文件
文件打开方式
Python2:open(name[, mode[, buffering]])
Python3:open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
参数说明:
Python2:
- name:文件名
- mode:文件打开模式
- buffering:缓冲区大小,如果未指定,则默认读取全部文本内容
Python3:
- file:参数file是一个字符串表示的文件名称,或者一个数组表示的文件名称。文件名称可以是相对当前目录的路径,也可以是绝对路径表示。
- mode:参数mode是指明打开文件的模式。默认值是’r’,表示使用文本的方式打开文件来读取。
- ‘r’表示打开文件只读,不能写。
- ‘w’表示打开文件只写,并且清空文件。
- ‘x’表示独占打开文件,如果文件已经存打开就会失败。
- ‘a’表示打开文件写,不清空文件,在文件后尾追加的方式写入。
- ‘b’表示二进制的模式打开文件。
- ‘t’表示文本模式,默认情况下就是这种模式。
- ‘+’打开文件更新(读取或写入)。
- 缺省时的模式就相当于’rt’。比如’w+b’就是打开文件进入读写,把文件清空;’r+b’打开文件,但不把文件清空。
- buffering:参数file是一个字符串表示的文件名称,或者一个数组表示的文件名称。文件名称可以是相对当前目录的路径,也可以是绝对路径表示。
-
1)对于二进制文件模式时,采用固定块内存缓冲区方式,内存块的大小根据系统设备的分配的磁盘块来决定,如果获取系统磁盘块的大小失败,就使用内部常量io.DEFAULT_BUFFER_SIZE定义的大小。一般的 操作系统上,块的大小是4096或者8192字节大小。
2)对于交互的文本文件(采用isatty()判断为True)时,采用一行缓冲区的方式。其它文本文件使用跟二进制一样的方式。 - encoding:参数encoding是指明对文件编码,仅适用于文本文件。如果不明编码方式,默认是使用locale.getpreferredencoding()函数返回的编码方式。
- errors:参数errors是用来指明编码和解码错误时怎么样处理。不能在二进制的模式下使用。
- 1)当指明为’strict’时,编码出错则抛出异常ValueError。
- 2)当指明为’ignore’时,忽略错误。
- 3)当指明为’replace’时,使用某字符进行替代模式,比如使用’?’来替换出错的。
- 4)其它相应还有surrogateescape/xmlcharrefreplacs/backslashreplace。
- closefd:参数closefd是用来当给一个文件句柄传进来时,而当退出文件使用时,而不对文件句柄进行关闭。如果传递一个文件名进来,这个参数无效,必定为True方式。
- opender:参数opener是用来实现自己定义打开文件方式。
- newline:参数newline是用来控制文本模式之下,一行的结束字符。可以是None,’’,\n,\r,\r\n等。
- 当在读取模式下,如果新行符为None,那么就作为通用换行符模式工作,意思就是说当遇到\n,\r或\r\n都可以作为换行标识,并且统一转换为\n作为文本输入的换行符。当设置为空’’时,也是通用换行符模式工作,但不作转换为\n,输入什么样的,就保持原样全输入。当设置为其它相应字符时,就会判断到相应的字符作为换行符,并保持原样输入到文本。
- 当在输出模式时,如果新行符为None,那么所有输出文本都是采用\n作为换行符。如果设置为’’或者\n时,不作任何的替换动作。如果是其它字符,会在字符后面添加\n作为换行符。