如何处理没有正确编码的文件?如何处理使用ASCII编码的文件?
从互联网上下载的文件几乎都是以字节而不是字符为单位的。如何从字节流中解码字符呢?
字节流使用b’前缀,使用decode()方法可以将字节解码为字符串。
In [1]: bytes_str=b'abc'
In [2]: bytes_str
Out[2]: b'abc'
In [3]: type(bytes_str)
Out[3]: bytes
In [4]: utf_str= bytes_str.decode('utf-8')
In [5]: utf_str
Out[5]: 'abc'
In [6]: type(utf_str)
Out[6]: str