用python调用pandas库打开csv文件时出现的
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xce in position 52: invalid continuation byte
可以看出出现的原因是Decode错误,也就是使用字符集‘utf-8’解码所打开文件内容时出现了无法解码的字符,同理,有时候编码也就是encode时也会出现无法编码的字符
解决办法的话,就是换一个字符集,我这边解决的时候换成了字符集‘ANSI’,当然可以换成其他的,如’ISO-8859-1’
附上代码:
出错的代码
train_df = pd.read_csv('train.csv')
改完的代码:
train_df = pd.read_csv('train.csv', encoding='ANSI')
#也就是加个encoding参数
本文介绍在使用Python的pandas库读取CSV文件时遇到UnicodeDecodeError的常见原因及解决方案。错误通常源于文件编码与指定编码不匹配,文章提供了一种通过更换字符集来解决问题的方法,并附带示例代码。
2973

被折叠的 条评论
为什么被折叠?



