引用:
在计算机内存中,统一使用Unicode编码,(严格地说,是unicode-16编码,一次读取2字节,因此速率快)
当需要保存到硬盘或者需要传输的时候,就转换为UTF-8编码。(utf-8可以节省存储空间,因此用于硬盘存储)
解码:b'\xe5\x9b\xbda'.decode('utf-8'):将python的字节编码内容按utf-8编码解析。
编码:'国a'.encode('utf-16'):将字符串内容按照utf-16编码进行编码存储。
在python中,字符变字节是编码;字节变字符是解码;如下例:
command-line(python):
>>> '国a'.encode('utf-8')
b'\xe5\x9b\xbda'
>>> '国a'.decode('utf-8')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>

本文详细介绍了Python中字符串的编码与解码过程,强调了Unicode编码在内存中的使用,以及UTF-8编码在硬盘存储和传输时的优势。通过示例展示了如何进行编码和解码操作,并解释了BOM在UTF-8文件中的作用和潜在问题,提醒开发者在处理UTF-8文件时应注意是否带BOM,以避免可能导致的错误。
最低0.47元/天 解锁文章
927

被折叠的 条评论
为什么被折叠?



