字符编码

字符编码

先介绍几类常见的编码格式:

ASCII

  • 只能表示英文字符,用1bytes对应一个英文字符

GBK

  • 可以表示中文和英文字符,用1bytes对应一个英文字符,2bytes对应一个中文字符

unicode

  • 可以对应所有国家的字符,统一用2bytes对应一个字符

所谓编码格式,可以想象成 记录和它对应的二进制数的关系的 一张表格

utf-8

  • utf-8是unicode格式的字符进行存储和传输的一种实现方式
  • 3bytes对应一个中文字符,1bytes对应一个英文字符

PS:

  • 保证不乱码的关键: 字符以什么编码的,就以什么解码,此时计算机只使用unicode与字符的对应关系
  • pyhon2中unicode就是python3的str类型
  • 在文件首行写上coding : utf-8就是在告诉python解释器,用文件头指定的编码

转载于:https://www.cnblogs.com/liangchengyang/p/9456761.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值