Python3使用CSV模块保存csv文件乱码问题

最新推荐文章于 2024-07-15 11:21:36 发布

原创

最新推荐文章于 2024-07-15 11:21:36 发布 · 2.2k 阅读

7 ·

CC 4.0 BY-SA版权

文章标签：

#Python #豆瓣电影 #爬虫 #技术 #学习

本文介绍了在使用Python3爬取豆瓣电影TOP250数据并保存为csv文件时遇到的中文乱码问题。通过尝试多种解决办法，最终找到一个有效的方法，即在写入csv文件时指定正确的编码。示例代码中展示了如何正确处理编码问题，避免出现中文乱码。

刚开始学写Python的时候，有一个练习是爬取豆瓣电影TOP250的数据，但是写完之后导出的csv文件里面中文内容都是乱码，

后来在网上找了好多内容，好多解决办法，最后只有一个有效，那就是：

with open('filename.csv', 'w', encoding='utf-8-sig', newline = '') as f:

修改后执行的效果：

之前用：

encoding='utf-8='

和

f.write(codecs.BOM_UTF8)

都没行。

附上完整的简单的爬取豆瓣电影TOP250数据代码：


# 第一步：导入第三方库
import codecs
import requests
import csv
import lxml.html

# 第二步：获取目标网页

# 第三步：解析目标网页
# 定义第一个函数：获取目标网页的数据（网页源代码）
def getSource(url):
    response = requests.get(url)
    response.encoding = 'utf-8'