刚开始学写Python的时候,有一个练习是爬取豆瓣电影TOP250的数据,但是写完之后导出的csv文件里面中文内容都是乱码,

后来在网上找了好多内容,好多解决办法,最后只有一个有效,那就是:
with open('filename.csv', 'w', encoding='utf-8-sig', newline = '') as f:
修改后执行的效果:

之前用:
encoding='utf-8='
和
f.write(codecs.BOM_UTF8)
都没行。
附上完整的简单的爬取豆瓣电影TOP250数据代码:
# 第一步:导入第三方库
import codecs
import requests
import csv
import lxml.html
# 第二步:获取目标网页
# 第三步:解析目标网页
# 定义第一个函数:获取目标网页的数据(网页源代码)
def getSource(url):
response = requests.get(url)
response.encoding = 'utf-8'

本文介绍了在使用Python3爬取豆瓣电影TOP250数据并保存为csv文件时遇到的中文乱码问题。通过尝试多种解决办法,最终找到一个有效的方法,即在写入csv文件时指定正确的编码。示例代码中展示了如何正确处理编码问题,避免出现中文乱码。
最低0.47元/天 解锁文章
734

被折叠的 条评论
为什么被折叠?



