UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xb1 in position 0: invalid start byte的解决办法

在处理国家统计局CSV数据时遇到了编码问题,起初尝试使用UTF-8编码无效,因为数据中包含中文,改为GBK编码后成功读取。此案例表明,解决编码问题需根据数据实际编码类型,对于中文数据,GBK通常是有效的选择。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

今天在读取一个从国家统计局下载的csv表格的时候遇到如上报错:
在这里插入图片描述
一看就知道是字符编码问题,但是到底要编码成哪种格式才是正确的呢? 掌柜搜了一下相关问题的解决方案,发现高赞给的答案是下面这个:
在这里插入图片描述
于是掌柜尝试过后发现并不能完全解决问题。。。😅在Province这一列还是出现的乱码。。。然后掌柜突然反应过来,Province这一列都是中文,一般中文编码都是用的gbk,所以应该是encoding = ‘gbk’ 才对吧。带着这样的想法填入后,再次运行,成功加载出全国各省近5年的GDP数据!
在这里插入图片描述

总结:
所以编码问题还是要看具体数据类型来处理。大多数encoding='utf-8’即可解决,但是如果表格包含中文,建议encoding='gbk’处理。

参考资料:
UnicodeDecodeError: ‘utf8’ codec can’t decode byte 0xa5 in position 0: invalid start byte

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值