【UnicodeDecodeError: 'gbk' codec can't decode byte 0xaf in position 304: illegal multibyte sequence】的解决方案
项目场景
运行机器学习示例程序的时候提示错误:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xaf in position 304: illegal multibyte sequence
问题描述
程序运行过程中出现:UnicodeDecodeError: 'gbk' codec can't decode byte 0xaf in position 304: illegal multibyte sequence
原因分析
使用Python
的时候常见的文本的编码与解码问题。
解决方案
1)在打开文本的时设置其编码格式,如
open(‘test.txt’, encoding=’gbk’);
2) 若 1) 不能解决,可能是文本中出现的一些特殊符号超出了gbk
的编码范围,可以选择编码范围更广的gb18030
,如
open(‘test.txt’, encoding=’gb18030’);
3) 若 2) 仍不能解决,说明文中出现了连gb18030
也无法编码的字符,可以使用ignore
属性进行忽略,如
open(‘test.txt’, encoding=’gb18030’, errors=‘ignore’);
常见解决方法
open(‘test.txt’).read().decode(‘gb18030’, ’ignore’);
End
参考
https://blog.youkuaiyun.com/shijing_0214/article/details/51971734