python encode decode unicode区别及用法

本文详细介绍了Unicode编码及其在不同环境下的应用,特别聚焦于如何在UTF-8编码中进行解码与转码操作。通过实例演示了将Unicode字符串转换为UTF-8编码,以及在Windows环境下使用GBK编码的解码过程,并讨论了可能出现的错误及解决策略。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

decode 解码

encode 转码

unicode是一种编码,具体可以百度搜

# coding: UTF-8
 
u = u''
print repr(u) # u'\u6c49'
s = u.encode('UTF-8')
print repr(s) # '\xe6\xb1\x89'
u2 = s.decode('UTF-8')
print repr(u2) # u'\u6c49'
 
# 对unicode进行解码是错误的
# s2 = u.decode('UTF-8')
# 同样,对str进行编码也是错误的
# u2 = s.encode('UTF-8')
s = u.encode('UTF-8') 是把u转码成utf-8
u2 = s.decode('UTF-8')是把u解码成utf-8
如果是windows下编码一般是gbk,所以解码时候要用 u.decode('gbk'),如下
>>> u='格式'
>>> u.decode('gbk')
u'\u683c\u5f0f'
>>> u.decode('utf-8')

Traceback (most recent call last):
  File "<pyshell#111>", line 1, in <module>
    u.decode('utf-8')
  File "C:\Python27\lib\encodings\utf_8.py", line 16, in decode
    return codecs.utf_8_decode(input, errors, True)
UnicodeDecodeError: 'utf8' codec can't decode byte 0xb8 in position 0: invalid start byte
>>> 

 

 
 

转载于:https://www.cnblogs.com/paisen/p/3483531.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值