python版本:3.6
读取csv文件时报错
f = open(file,'r')
line = f.readline()
print(line)报错:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb8 in position 2: invalid start byte解决方法:
1. 确认文件是否是utf-8格式,可以通过sublime这样的文本打开看,如果乱码,基本可以确定不是utf-8
2. 如果是在Windows上,确认文件是否开头含bom格式,如果包含,去掉bom头重试
3. 也有可能是二进制文件,使用“rb”模式打开测试
4. 测试编码使用模块chardet的方法: chardet.detect(bytes_content),检测当前编码,之后可以根据需要进行decode等转码操作
本次遇到的是打开模式错误,使用“wb”模式打开后正常,即修改打开文件代码打开模式即可。
f = open(file,'rb')
本文介绍了解决Python读取CSV文件时出现乱码问题的方法。包括确认文件编码格式、去除BOM头、使用正确的文件打开模式以及利用chardet模块检测文件编码。
1万+

被折叠的 条评论
为什么被折叠?



