# 背景
由于历史原因,python字符编码对多语种的支持有问题。
asc2 美国标准 一个字节 256种表示
unicode 16位置 65536种表示
utf-8 可变长度的编码,其中包含asc2码(1byte)的编码,utf-8(可能3个byte)。
str = u'中文字符串'
str.encode('utf-8)
str.decode('utf-8)
# 背景
由于历史原因,python字符编码对多语种的支持有问题。
asc2 美国标准 一个字节 256种表示
unicode 16位置 65536种表示
utf-8 可变长度的编码,其中包含asc2码(1byte)的编码,utf-8(可能3个byte)。
str = u'中文字符串'
str.encode('utf-8)
str.decode('utf-8)