爬苹果日报新闻时用requests解析到的网页是乱码
用了下面这个就解决了
title_content.encode('ISO-8859-1').decode('utf-8')
繁体中文可以正常显示了,但是还没搞懂为什么
之后记得研究一下
参考下面几篇有点略懂但还不是很清晰,之后得好好研究一下编码问题
https://www.jianshu.com/p/e487e89c2a4e
https://blog.youkuaiyun.com/u012272186/article/details/78433550
http://www.langzi.fun/Python%E5%AD%97%E7%AC%A6%E9%9B%86%E7%BC%96%E7%A0%81.html
Python爬取网页解决乱码问题
博主在使用Python的requests库爬取苹果日报新闻时,解析到的网页出现乱码。通过使用title_content.encode('ISO - 8859 - 1').decode('utf - 8')解决了问题,使繁体中文能正常显示,但还未弄懂原理,后续打算研究编码问题,并给出了相关参考链接。
3万+

被折叠的 条评论
为什么被折叠?



