Jupyter notebook 导出的csv 文件是乱码的解决方案

最新推荐文章于 2024-07-15 11:21:36 发布

原创最新推荐文章于 2024-07-15 11:21:36 发布 · 8.4k 阅读

18 ·

CC 4.0 BY-SA版权

文章标签：

#CSV

python 同时被 2 个专栏收录

6 篇文章

订阅专栏

小知识

2 篇文章

订阅专栏

本文介绍了一种解决pysparkDataFrame转换为CSV文件时出现中文乱码的方法。通过将CSV文件以ANSI编码方式打开，再另存为UTF-8编码，解决了导出文件中中文显示乱码的问题。文章提供了具体的pyspark导出代码示例。

本人使用的是Jupyter notebook 编辑器做数据分析的，API 是pyspark,有时候需要把 pyspark DataFrame 转成 pandas Dataframe,然后转成CSV 文件去汇报工作，发现有中文导出的时候是乱码，问了运维的同事的他们已经设置成了UTF-8 的模式，我在代码里也设置了UTF-8 .后来发现是CSV的问题，先将CSV用txt记事本打开，然后选择ANSI编码方式。另存为，点编码这里，这里的编码有这么几种选择，最后用excel去打开就可以了。

这里写图片描述