虽然现在大多数文本内容Python都是可以读取的,利用f=open().read()即可把文本内容赋予变量f,但是对于某些刺儿头,比如gbk编码的文本,这招就不能用了。为此,当遇到非UTF-8编码的文件时,请用codecs.open 代替.open具体用例如下:
import codecs
f=codecs.open(file,'r','utf-8').read()
大功告成,下回再见!
本文介绍如何使用Python处理非UTF-8编码的文本文件,特别是遇到gbk编码等特殊情况时,通过使用codecs模块替代标准open方法来正确读取文件内容。
虽然现在大多数文本内容Python都是可以读取的,利用f=open().read()即可把文本内容赋予变量f,但是对于某些刺儿头,比如gbk编码的文本,这招就不能用了。为此,当遇到非UTF-8编码的文件时,请用codecs.open 代替.open具体用例如下:
import codecs
f=codecs.open(file,'r','utf-8').read()
大功告成,下回再见!

被折叠的 条评论
为什么被折叠?