ascii、unicode、utf-8、gbk 区别

本文深入解析了Python2与Python3在编码方式上的核心差异,详细阐述了ascii、unicode、utf-8及gbk等编码标准的特点与应用。ascii仅能表示256个符号,而unicode和utf-8作为万国码,分别使用两个和三个字节表示字符,后者更适配中文环境。gbk在国内使用广泛,中文字符仅需两个字节。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

python2内容进行编码(默认ascii),而python3对内容进行编码的默认为utf-8。
ascii:最多只能用8位来表示(一个字节),即:2**8 = 256(即pow(2,8)=256),所以,ASCII码最多只能表示256个符号。
unicode:万国码,任何一个字符==两个字节
utf-8:万国码的升级版,一个中文字符==三个字节,英文是一个字节,欧洲的是2个字节
gbk:国内版本,一个中文字符==2个字节,英文是一个字节
gbk转utf-8,则需通过媒介unicode

转载于:https://www.cnblogs.com/konglingxi/p/10205950.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值