在pandas中读取带有中文的csv文件时,读写中汉字为乱码,可加上encoding参数来避免,如:
pd.read_csv(“xxx.csv”, encoding=”gb2312”)
pd.read_csv(“xxx.csv”, encoding=”gbk”)
在导出时也要加上encoding参数,否则导出后用excel打开也是乱码,editplus打开正常,如:
df.to_csv(“sel.csv”, index=False, encoding=”gb2312”)
df.to_csv(“sel.csv”, index=False, encoding=”gbk”)
本文介绍如何使用pandas处理含有中文的CSV文件时出现的乱码问题,通过设置正确的编码方式,确保数据读取和导出时中文字符的正确显示。
2606

被折叠的 条评论
为什么被折叠?



