python中decode和encode的使用

本文详细介绍了Python中不同编码之间的转换方法,包括从一种编码到Unicode的解码过程、从Unicode到另一种编码的编码过程,以及两种非Unicode编码间的转换流程。同时提供了具体的Python代码示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

python中的编码是采用unicode编码的,在做编译转换时,需要使用unicode作为中间编码:

情况一:编码一-->unicode编码

将其他编码的字符串解码:decode成unicode;

a.decode(‘gb2312’)
或者:

unicode.unicode(a,'gb2312')
情况二:unicode编码-->编码一

       从unicode编码成另一种编码就使用encode!

a.encode("gb2312")
情况三:编码一-->编码二:就是两种非unicode编码之间的转化呢?

编码一----->解码为unicode----->编码成编码二

unicode.unicode(a,'gb2312').encode("ascii")

     用法:str.decode("ascii"):将ascii编码的字符串str解码称为unicode编码

str.encode("ascii"),将unicode 编码转化成ascii编码!


在编码之前,首先应该知道的是,原始字符串的编码格式:

在python中,可以通过第三方库chardet进行查询:


  ascii编码,就是unicode一个子集么?因为我发现,一个ascii编码的字符串,判断其是不是unicode编码的时候,结果返回的是True!(这几个的关系,不太懂!)

如何判断一个字符串是不是unicode编码呢?


======================UTF-8的情况======================================

如果有一个test = "钓鱼岛是中国的"!


上述情况,如果在UTF-8文件中,它就是UTF-8编码,如果在GB2312文件中,那就是GB2312编码,那如果需要在这两个编码之间转化呢?首先进行解码(decode),称为unicode编码,再进行编码encode,如果一个编码已经是unicode编码了,如果再次对其进行编码将会出错。

如果指定文件的编码方式,那么就按照系统默认的编码方式,按照如下的语句查询系统的默认编码方式

上图是python2.7.3的默认编码方式,是python3的编码方式








评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值