偶然发现mac上的csv到了windows系统上会乱码,一番折腾之后发现是字符编码问题:终于搞懂 ASCII,Unicode,utf8,gbk 编码之间的关系
excel 对编码的要求比较高,不过pandas就比较随便了,来者通吃
于是用pandas打开未知编码的csv,再保存一下就OK了
以下就是 csv 编码转换的代码:
import os
import pandas as pd
for root,dirs,files in os.walk(path):
for file in files:
if 'csv' in file:
abs_path = os.path.join(root,file)
with open(abs_path, 'r', encoding='utf8') as f:
df = pd.read_csv(f, delimiter=',')
df.to_csv(abs_path, index=False)
本文揭示了Mac CSV到Windows系统中出现乱码的原因,并介绍了如何使用pandas处理不同编码的CSV文件,通过实例展示了如何使用Python代码进行编码转换。
1550

被折叠的 条评论
为什么被折叠?



