python字符编码

python3 文件里面默认编码 是utf-8
字符串 编码是 Unicode

python2 文件默认是编码 是ascii
字符串 编码 默认是ascii
如果文件头声明gbk 那字符串的编码就是gbk

Unicode 是单独类型

 1 方法是 decode(编码) 和 encode(编码)
 2 UTF-8  -->> decode 解码 -->>  Unicode
 3 Unicode   -->> encode(编码)   -->>  GBK/UTF08
 4 
 5 编码
 6 字节,位
 7     unicode  utf8 gbk
 8     utf8  3个字节
 9     gbk   2 个字节
10     
11     
12 
13 
14 print(s1)
15 s5 = s1.decode("utf-8")
16 print(s5)
17 print(type(s5))
18 
19 s6 = s5.encode('gbk')
20 print(s6)
21 print(type(s6))
22 
23 s7 = s5.encode("utf-8")
24 print(s7)
25 print(type(s7))
26 
27 
28 gbk  -->> decode(解码)  -->>  unicode   -->> encode(编码)  -->> shift-jis  日本编码
29 gbk  <<-- encode(编码)  <<--  Unicode   <<-- decode(解码)  <<-- shift-jis  日本编码

 

转载于:https://www.cnblogs.com/Black-Hawk/articles/10340160.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值