python 中文字符转换unicode及Unicode 编码转换为中文

本文介绍了如何在Python中使用`decode`和`encode`函数进行字节编码与Unicode编码的转换,包括`unicode-escape`编码用于处理中文,以及使用百分号替换``进行转码和还原的过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

废话不多说 直接开干
在这里插入图片描述
知识点

decode 字节编码可decode为str
encode 将字符串转换为bytes类型的对象 (即b为前缀, bytes类型), 即Ascll编码, 字节数组
encode(‘unicode-escape’)可将此str编码为bytes类型, 内容则是unicode形式
decode(‘unicode-escape’)可将内容为unicode形式的bytes类型转换为str

将一段中文转成unicode编码

#将中文转换为 Unicode 编码
chinese_str = "中文"
print(chinese_str.encode('unicode-escape'))
#b'\\u4e2d\\u6587'

#将 Unicode 编码转换为中文

#将 Unicode 编码转换为中文
unicode_str = "\\u4e2d\\u6587"
chinese_str = bytes(unicode_str, 'utf-8').decode('unicode_escape')
print(chinese_str)
#中文

再用%百分号替换\双反斜杠后,就得到了转码之后的unicode类型字符串(%u****)

chinese_str = "中文"

print(chinese_str.encode('unicode-escape').decode().replace('\\','%'))
#%u4e2d%u6587

unicode类型的字符串转换成中文

chinese_str = "中文"
result = chinese_str.encode('unicode-escape').decode().replace('\\','%')

print(result.replace('%','\\').encode().decode('unicode-escape'))
#中文
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值