python3 文件里面默认编码 是utf-8
字符串 编码是 Unicode
python2 文件默认是编码 是ascii
字符串 编码 默认是ascii
如果文件头声明gbk 那字符串的编码就是gbk
Unicode 是单独类型
1 方法是 decode(编码) 和 encode(编码) 2 UTF-8 -->> decode 解码 -->> Unicode 3 Unicode -->> encode(编码) -->> GBK/UTF08 4 5 编码 6 字节,位 7 unicode utf8 gbk 8 utf8 3个字节 9 gbk 2 个字节 10 11 12 13 14 print(s1) 15 s5 = s1.decode("utf-8") 16 print(s5) 17 print(type(s5)) 18 19 s6 = s5.encode('gbk') 20 print(s6) 21 print(type(s6)) 22 23 s7 = s5.encode("utf-8") 24 print(s7) 25 print(type(s7)) 26 27 28 gbk -->> decode(解码) -->> unicode -->> encode(编码) -->> shift-jis 日本编码 29 gbk <<-- encode(编码) <<-- Unicode <<-- decode(解码) <<-- shift-jis 日本编码