Python 问题--encode、decode及shell中文输出

本文探讨了Python中的编码问题,重点介绍了encode和decode的使用,如何判断字符串类型,以及在命令行中正确输出中文的方法。通过decode将其他编码转为unicode,再用encode转换为所需编码。在win7系统中,系统默认编码为ascii,可通过代码设置默认编码。输出中文时,可以使用raw_input或print,确保字符串为unicode类型。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近在使用python的时候,涉及到中文输出的时候经常会出现乱码的问题,所以就上网搜索了下,参考了

1.Python字符串的encode与decode研究心得乱码问题解决方法
2.python 中编码的再次学习
此外,更多详细字符编码的可以看看这篇文章–字符编码详解

1.encode和decode

(1)字符串在python内部的表示是unicode编码,所以做编码转换的时候就是使用unicode作为中间编码,先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。
(2)decode的作用是将其他编码的字符串转换成unicode编码,如str1.decode(‘gb2312’),表示将gb2312编码的字符串str1转换成unicode编码。
(3)encode的作用是将unicode编码转换成其他编码的字符串,如str2.encode(‘gb2312’),表示将unicode编码的字符串str2转换成gb2312编码。

2.判断类型

可以通过isinstance()函数来判断字符串是否是unicode还是str类型,
这里写图片描述
如上图所示,字符串类型是str,而在要声明unicode类型则需要在引号前加u。

此外,可以通过下图的方法获得系统的默认编码方式:
这里写图片描述
因为使用的是win7系统,所以系统默认编码是ascii。
还可以在代码中设置默认编码方式:

reload(sys)
sys.setdefaultencoding("utf-8")

3.输出中文

(1)raw_input方式
如下图,可以有两种方式在命令行中能正确输出中文,而不是乱码:
这里写图片描述
(2)print 方式
当采用print时,只需要将中文声明为unicode类型即可正确显示。
这里写图片描述

所以可以根据以下代码输出中文,其中’gb2312’也可以换为’gbk’。


#!/usr/bin/env python 
#coding=utf-8 
s="中文" 

if isinstance(s, unicode): 
    #s=u"中文" 
    print s.encode('gb2312') 
else: 
    #s="中文" 
    print s.decode('utf-8').encode('gb2312')
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

spearhead_cai

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值