pandans.read_csv()和.to_csv()方法中的encoding参数问题

最新推荐文章于 2024-04-21 22:56:37 发布

转载最新推荐文章于 2024-04-21 22:56:37 发布 · 5k 阅读

文章标签：

#python csv encoding

python实战经验专栏收录该内容

6 篇文章

订阅专栏

本文详细解析了在使用Python处理含中文的CSV文件时，如何正确设置to_csv()和read_csv()方法的encoding参数，避免编码冲突导致的数据读写错误。推荐在处理中文数据时统一使用'gbk'编码。

参考：https://www.cnblogs.com/maoguy/p/6807941.html
在含有中文编码的情况下，to_csv()方法的encoding参数默认为"gbk"，而read_csv()方法的encoding参数默认为"utf-8"，所以最好的防止由于编码出错导致读取错误的方法就是在to_csv()和read_csv()方法同时显式地设置相同的encoding参数。
所以以我自己实验来看，一般如果从别人那里拿到csv文件，read_csv的encoding参数选择‘gbk’，之后to_csv时，encoding参数可以选择‘gbk’也可以是'utf-8'，但是如果是'utf-8'，则保存的文件中的会乱码（如果文件中有中文的话），所以建议选择'gbk'。
python中的encode，decode问题：
参考https://www.cnblogs.com/testlife007/p/5163507.html