pandans.read_csv()和.to_csv()方法中的encoding参数问题

本文详细解析了在使用Python处理含中文的CSV文件时,如何正确设置to_csv()和read_csv()方法的encoding参数,避免编码冲突导致的数据读写错误。推荐在处理中文数据时统一使用'gbk'编码。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

参考:https://www.cnblogs.com/maoguy/p/6807941.html
在含有中文编码的情况下,to_csv()方法的encoding参数默认为"gbk",而read_csv()方法的encoding参数默认为"utf-8",所以最好的防止由于编码出错导致读取错误的方法就是在to_csv()和read_csv()方法同时显式地设置相同的encoding参数。
所以以我自己实验来看,一般如果从别人那里拿到csv文件,read_csv的encoding参数选择‘gbk’,之后to_csv时,encoding参数可以选择‘gbk’也可以是'utf-8',但是如果是'utf-8',则保存的文件中的会乱码(如果文件中有中文的话),所以建议选择'gbk'。
python中的encode,decode问题:
参考https://www.cnblogs.com/testlife007/p/5163507.html
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值