6、字符编码

编码表介绍及Python编码默认设置
博客介绍了多种编码表,如GB2312、GBK1.0、GB18030、unicode、UTF - 8等的特点和字符包含情况,还提及编码发展路径。同时说明了Python2.X默认用Assic编码,Python3.X默认用unicode编码,以及windows改为GBK的命令。

第一张支持中文的编码表GB2312(1980年)支持7445个字符,包括6763个汉字和632和其他字符;
GBK1.0(1995年)汉字区包含21003个字符;
GB18030(2000年)包含27484个汉字和其他少数民族文字;
unicode:万国码 支持所有的国家和地区的编码
2**16 = 65535 存一个字符统一占用两个字节
UITF-8 : Unicode的扩展集,可变长的字符编码集
英文一个字节,欧洲的字符使用两个字节保存,东亚的字符三个字节
Assic-->GB2313-->GBK1.0-->GB18030
Assic-->unicode-->utf-8

python2.X 默认使用Assic编码
python3.X 默认使用unicode编码

windowds 改为GBK:chcp 936

转载于:https://www.cnblogs.com/hlc-123/p/10915232.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值