python字符编码错误的解决方案

最新推荐文章于 2021-02-22 12:34:43 发布

chongchunwan2002

最新推荐文章于 2021-02-22 12:34:43 发布

阅读量170

点赞数

原文链接：https://my.oschina.net/u/2406006/blog/714271

版权

本文详细介绍了在Python中遇到的各种编码与乱码问题及其解决方案，包括如何处理非ASCII字符、PyQt中的中文乱码及非法字符导致的UnicodeDecodeError。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文地址：http://blog.youkuaiyun.com/jiuzuidongpo/article/details/49587169

转载请注明

第一条：SyntaxError: Non-ASCII character '\xc4' in file E:\***.py on line 3, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details。

[解决方案]

在文件头上添加一行

#coding:utf-8

第二条：用self.tr()的时候，中文出现乱码（使用PyQt开发）

[解决方案]
在类上方添加
QTextCodec.setCodecForTr(QTextCodec.codecForName("utf8"))

第三条：UnicodeDecodeError: ‘XXX' codec can't decode bytes in position 2-5: illegal multibyte sequence
错误信息：
UnicodeDecodeError: ‘XXX' codec can't decode bytes in position 2-5: illegal multibyte sequence
这是因为遇到了非法字符，因此在转码的过程中出现了异常。具体哪些字符是非法字符我也搞不清。
[解决办法]
#将获取的字符串strTxt做decode时，指明ignore，会忽略非法字符,这样就可以了
inStr2 = inStr.decode('utf-8', 'ignore')
默认的参数就是strict，代表遇到非法字符时抛出异常；
如果设置为ignore，则会忽略非法字符；
如果设置为replace，则会用?号取代非法字符；
如果设置为xmlcharrefreplace，则使用XML的字符引用。
[解决办法二]
在文件开头加上三行
import sys
reload(sys)
sys.setdefaultencoding('utf8')