在python中解码中文的时候,可能报以下错误:
data.decode('gbk');
'gbk' codec can't decode bytes in position xxx illegal multibyte ...
可以尝试把gbk换成'GB18030'
因为gbk相对于gb2312包含的字符更多,但是GB18030包含的字符数又大于gbk.所以试试GB18030
题外话,按照一些理论GB18030有的时候也不好用。
最好的办法就是在所有的程序设计和编码的时候使用utf-8.
本文介绍在Python中遇到的中文解码错误问题,详细解释了如何从使用GBK编码转换为GB18030编码来解决此问题,并讨论了GB18030的局限性。最后推荐使用更广泛的UTF-8编码作为最佳实践。
1594

被折叠的 条评论
为什么被折叠?



