在爬取网页的时候经常使用到request库来获取网页的源码
request会根据网页中的编码方式来进行编码,但是有时request获取到的网页中中文出现了乱码,但是查看获取到的编码当时依旧是utf-8的编码。
按照其他的方法来指定编码方式为utf-8后并不能解决这个问题
response = requests.get(url, headers = headers)
response.encoding = 'utf-8'
但是虽然制定了编码方式,但是网页中的中文依旧乱码

查看了一些博客之后,基本上都是将编码方式指定为utf-8的编码,但是问题并没有解决
之后看到可以转换成gbk的编码方式,于是乎,进行尝试,发现的确可以正常的显示、
response = requests.get(url, headers = headers)
response.encoding = 'gbk'
本文探讨了在使用request库爬取网页时遇到的中文乱码问题,指出即使指定编码为utf-8也无法解决乱码,而转换为gbk编码则能正常显示中文。
3247

被折叠的 条评论
为什么被折叠?



