参考:https://www.cnblogs.com/maoguy/p/6807941.html
在含有中文编码的情况下,to_csv()方法的encoding参数默认为"gbk",而read_csv()方法的encoding参数默认为"utf-8",所以最好的防止由于编码出错导致读取错误的方法就是在to_csv()和read_csv()方法同时显式地设置相同的encoding参数。
所以以我自己实验来看,一般如果从别人那里拿到csv文件,read_csv的encoding参数选择‘gbk’,之后to_csv时,encoding参数可以选择‘gbk’也可以是'utf-8',但是如果是'utf-8',则保存的文件中的会乱码(如果文件中有中文的话),所以建议选择'gbk'。
python中的encode,decode问题:
参考https://www.cnblogs.com/testlife007/p/5163507.html
pandans.read_csv()和.to_csv()方法中的encoding参数问题
最新推荐文章于 2024-04-21 22:56:37 发布
本文详细解析了在使用Python处理含中文的CSV文件时,如何正确设置to_csv()和read_csv()方法的encoding参数,避免编码冲突导致的数据读写错误。推荐在处理中文数据时统一使用'gbk'编码。
1227

被折叠的 条评论
为什么被折叠?



