python3编码

本文介绍了编码发展历程,从ASCII到Unicode再到UTF-8,并详细解释了这些编码在中国的应用变化。同时,文中还对比了Python2与Python3在默认编码方面的区别。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、编码发展起源:

    编码最早来源于ASCII码,共占用1byte  其中0-127表示英文大小写字母及其它字符,剩余128位预留给其余国家使用(从汉字的博大精深来看,这点量压根就不够)。

    随着我国计算机技术的发展,在1980年 使用gb2312(内涵7000个常用中文),1995年 升级至GBK1.0(内涵20000多中文),2000年 升级至GB18030(内涵27000多中文),在我国编码发展的同时,非使用英文国家也在发展自己的编码方式,就造成了不同国家之间的软件,无法互装,为解决这个问题,国际组织提出使用unicode,共占用2字节 将大部分语言统一规划到unicode中,但由于英文编码位数的浪费,又对其进行升级,最后定制了最新的utf-8编码,其中英文表示占1byte,中文表示占3bytes


2、Python2与Python3

    Python2中默认使用ASCII编码

        可在Python2中开头加入 #-*- coding:utf-8 -*-  就可解码中文内容

    Python3中默认使用UTF-8编码

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值