如何处理没有正确编码的文件?如何处理使用ASCII编码的文件?
从互联网上下载的文件几乎都是以字节而不是字符为单位的。如何从字节流中解码字符呢?
字节流使用b’前缀,使用decode()方法可以将字节解码为字符串。
In [1]: bytes_str=b'abc'
In [2]: bytes_str
Out[2]: b'abc'
In [3]: type(bytes_str)
Out[3]: bytes
In [4]: utf_str= bytes_str.decode('utf-8')
In [5]: utf_str
Out[5]: 'abc'
In [6]: type(utf_str)
Out[6]: str
博客聚焦于文件编码处理问题,指出从互联网下载的文件多以字节为单位,探讨如何从字节流中解码字符。介绍了字节流使用b’前缀,可通过Python的decode()方法将字节解码为字符串,解决没有正确编码或使用ASCII编码的文件处理问题。
10万+

被折叠的 条评论
为什么被折叠?



