python学习笔记之python中处理中文

本文详细介绍了在Python中如何正确处理包含中文字符的字符串,包括设置编码、创建Unicode字符串、打印输出中文字符的方法以及从不同编码转换为Unicode字符串的步骤。
部署运行你感兴趣的模型镜像

一、只有中文注释

python文件的头部加上:#coding=gbk 或者 #coding=utf-8

使用 #coding:gbk 或 #coding:utf-8也是一样的。

二、创建包含中文的字符串

str = u”python中文字符串”,前面的u代表这是一个unicode字符串,一般英文字符采用ACSII编码。

三、打印输出中文字符

方法一、

str = u’中文字符串’

print str.encode(“gbk”)

这样就可以输出中文了,前提是设置了#coding=gbk或者是#coding=utf-8

方法二、

sys.stdout绑定到一个包装为gbk输出的流上

sys.stdout=codecs.lookup("gbk")[-1](sys.stdout)

现在可以通过print str 直接从终端输出中文了。

Note:

unicode转换为不同编码的字符串的函数是:encode

比如转换utf-8,那么使用unicodestring.encode(“utf-8”)

转换ascii,那么使用unicodestring.encode(“ascii”)

转换为gbk编码,那么使用unicodestring.encode(“gbk”)

从不同编码的字符串转换为unicode字符串的函数是:unicode

如果str是一个ascii编码的字符串,那么使用如下方式转换为unicode:

unicodestr = unicode(str, “ascii”)

如果strgbk编码的,使用:

unicodestr = unicode(str, “gbk”)

您可能感兴趣的与本文相关的镜像

Python3.11

Python3.11

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值