文章内容均出自《python爬虫开发》
文章目录
2.1 文件操作
2.1.1 打开文件:open与with open () as
使用Python打开一个文本文件时,首先要保证这个文件是存在的。
可以直接将文本文件和Python文件放在一起,这样就可以直接使用文件名来打开文本文件。
在读文件的时候,“文件操作方式”这个参数可以省略,也可以写成“r”,也就是read的首字母。
“open”这个关键字它的作用是打开一个文件,并创建一个文件对象。
##方式一:open,需要手动关闭
方式二:上下文管理(自动关闭)
参数 :encoding
这里有一个参数“encoding”。这个参数特别有用,它可以在打开文件的时候将文件转换为UTF-8编码格式,从而避免乱码的出现。这个参数只有Python 3有,在Python 2中使用这个参数会报错。如果文件是在Windows中创建的,并且使用UTF-8打开文件出现了乱码,可以把编码格式改为GBK。
2.1.2 阅读文件:read与readlines
read:直接把文件里面的全部内容用一个字符串返回:
f.read()
readlines:读取所有行,并以列表的形式返回结果:
f.readlines()
2.1.3 写入文件:write与writelines
这里多出来一个参数“w”, w是英文write的首字母,意思是以写的方式打开文件。这个参数除了为“w”外,还可以为“a”。它们的区别在于,如果原来已经有一个new.txt文件了,使用“w”会覆盖原来的文件,导致原来的内容丢失;而使用“a”,则会把新的内容写到原来的文件末尾。
其他参数如下:
方式一:write
直接将一大段字符串写入到文本中,可以使用下面这一行代码:
f.writ