刚开始学写Python的时候,有一个练习是爬取豆瓣电影TOP250的数据,但是写完之后导出的csv文件里面中文内容都是乱码,
后来在网上找了好多内容,好多解决办法,最后只有一个有效,那就是:
with open('filename.csv', 'w', encoding='utf-8-sig', newline = '') as f:
修改后执行的效果:
之前用:
encoding='utf-8='
和
f.write(codecs.BOM_UTF8)
都没行。
附上完整的简单的爬取豆瓣电影TOP250数据代码:
# 第一步:导入第三方库
import codecs
import requests
import csv
import lxml.html
# 第二步:获取目标网页
# 第三步:解析目标网页
# 定义第一个函数:获取目标网页的数据(网页源代码)
def getSource(url):
response = requests.get(url)
response.encoding = 'utf-8'