一、只有中文注释
在python文件的头部加上:#coding=gbk 或者 #coding=utf-8
使用 #coding:gbk 或 #coding:utf-8也是一样的。
二、创建包含中文的字符串
str = u”python中文字符串”,前面的u代表这是一个unicode字符串,一般英文字符采用ACSII编码。
三、打印输出中文字符
方法一、
str = u’中文字符串’
print str.encode(“gbk”)
这样就可以输出中文了,前提是设置了#coding=gbk或者是#coding=utf-8
方法二、
将sys.stdout绑定到一个包装为gbk输出的流上
sys.stdout=codecs.lookup("gbk")[-1](sys.stdout)
现在可以通过print str 直接从终端输出中文了。
Note:
从unicode转换为不同编码的字符串的函数是:encode
比如转换utf-8,那么使用unicodestring.encode(“utf-8”)
转换ascii,那么使用unicodestring.encode(“ascii”)
转换为gbk编码,那么使用unicodestring.encode(“gbk”)
从不同编码的字符串转换为unicode字符串的函数是:unicode
如果str是一个ascii编码的字符串,那么使用如下方式转换为unicode:
unicodestr = unicode(str, “ascii”)
如果str是gbk编码的,使用:
unicodestr = unicode(str, “gbk”)
本文详细介绍了在Python中如何正确处理包含中文字符的字符串,包括设置编码、创建Unicode字符串、打印输出中文字符的方法以及从不同编码转换为Unicode字符串的步骤。
168

被折叠的 条评论
为什么被折叠?



