import csv
import sys
import codecs
reload(sys)
sys.setdefaultencoding('utf8')
with open('out.csv', 'w') as fw:
csv_writer = csv.writer(fw,delimiter=' ')
with codecs.open(input, 'r', 'utf-8') as f:
for line in f:
line = line.strip() #'\xe2\x80\x8b'
line_parts = line.split('\t')
csv_writer.writerow([line_parts[0].encode("gbk", "ignore")])
本文探讨了Python中使用csv模块结合codecs进行文件读写的过程,重点讲解了如何将UTF-8编码的输入文件转换为GBK编码并输出到CSV文件的实践方法。通过实例代码演示,读者可以学习到跨编码环境下数据处理的实用技巧。
2409

被折叠的 条评论
为什么被折叠?



